[发明专利]一种工资条项目识别方法、装置、设备及可读存储介质有效
申请号: | 201811444735.8 | 申请日: | 2018-11-29 |
公开(公告)号: | CN109543668B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 钱力扬;王培勇;陈宏仁 | 申请(专利权)人: | 税友软件集团股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 310053 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种工资条项目识别方法,该方法包括以下步骤:获取目标工资条的项目序列,并对项目序列进行清洗,获得目标项目序列;利用完全匹配字典、模糊匹配字典和TF‑IDF分别对目标项目序列中的各个字段分别进行加权,获得完全加权矩阵、模糊加权矩阵和TF‑IDF加权矩阵;对完全加权矩阵、模糊加权矩阵和TF‑IDF加权矩阵进行矩阵拼接,获得综合加权矩阵;将综合加权矩阵中各个字段的向量输入至分类器中进行识别,获得识别结果。可提高工资条项目识别的准确率。本发明还公开了一种工资条项目识别装置、设备及可读存储介质,具有相应的技术效果。 | ||
搜索关键词: | 一种 工资条 项目 识别 方法 装置 设备 可读 存储 介质 | ||
【主权项】:
1.一种工资条项目识别方法,其特征在于,包括:获取目标工资条的项目序列,并对所述项目序列进行清洗,获得目标项目序列;利用完全匹配字典,对所述目标项目序列中的各个字段分别进行加权,获得完全加权矩阵;利用模糊匹配字典,对所述目标项目序列中的各个所述字段分别进行加权,获得模糊加权矩阵;利用TF‑IDF,对所述目标项目序列中的各个所述字段分别进行加权,获得TF‑IDF加权矩阵;对所述完全加权矩阵、模糊加权矩阵和所述TF‑IDF加权矩阵进行矩阵拼接,获得综合加权矩阵;将所述综合加权矩阵中各个所述字段的向量输入至分类器中进行识别,获得识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于税友软件集团股份有限公司,未经税友软件集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811444735.8/,转载请声明来源钻瓜专利网。