[发明专利]基于机器学习的变量自动分类方法及系统在审
申请号: | 202011272803.4 | 申请日: | 2020-11-13 |
公开(公告)号: | CN112381143A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 魏强;孙向学;张上亚;王臣亮;张学敬;翟迪;马静静;郁峰 | 申请(专利权)人: | 长城计算机软件与系统有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/289;G06F16/215;G06N20/00 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 吴佳 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于机器学习的变量自动分类方法及系统,涉及信息处理技术领域。该方法包括:获取待处理的报表,提取报表的文本信息;从本文对象中提取文本信息,利用预设的分词算法将文本信息拆分成词语,从词语中提取变量特征词;从词性识别对象中提取变量特征词,将提取的变量特征词与变量词库中的变量进行比较,形成用于抽取特征词的分类规则;根据分类规则将变量特征词抽取到对应的变量块中。本发明提供的变量自动分类方法基于机器学习实现,适用于统计类报表的变量自动分类,实现了利用机器学习创建变量自动分类的方法,可以解决在数据统计过程中繁琐复杂的变量识别工作。 | ||
搜索关键词: | 基于 机器 学习 变量 自动 分类 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长城计算机软件与系统有限公司,未经长城计算机软件与系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011272803.4/,转载请声明来源钻瓜专利网。