[发明专利]文本分类方法及装置有效
申请号: | 201610354930.6 | 申请日: | 2016-05-25 |
公开(公告)号: | CN107436875B | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 刘炳源;张旭 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 罗振安 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文本分类方法及装置,属于计算机技术领域。所述方法包括:对于业务信息库的关键词库中包括的多个关键词中的每个关键词,根据词向量模型,确定关键词对应的词向量;基于关键词对应的词向量,确定关键词的潜在扩展词;当接收到针对潜在扩展词输入的扩展规则,且当检测到针对潜在扩展词的添加指令时,将潜在扩展词添加到关键词库中,并将扩展规则添加到匹配规则库中;基于关键词库和匹配规则库,通过模式匹配分类器确定待分类的文本属于多个预设类别中每个预设类别的第一概率;基于第一概率,从多个预设类别中,确定待分类的文本所属的类别。本发明可以降低构建业务信息库的人工成本,且可以提高文本分类的覆盖率和准确率。 | ||
搜索关键词: | 文本 分类 方法 装置 | ||
【主权项】:
一种文本分类方法,其特征在于,所述方法包括:对于业务信息库的关键词库中包括的多个关键词中的每个关键词,根据词向量模型,确定所述关键词对应的词向量;基于所述关键词对应的词向量,确定所述关键词的潜在扩展词;当接收到针对所述潜在扩展词输入的扩展规则,且当检测到针对所述潜在扩展词的添加指令时,将所述潜在扩展词添加到所述关键词库中,并将所述扩展规则添加到所述业务信息库的匹配规则库中;基于所述关键词库和所述匹配规则库,通过模式匹配分类器确定待分类的文本属于多个预设类别中每个预设类别的第一概率;基于所述待分类的文本属于所述多个预设类别中每个预设类别的第一概率,从所述多个预设类别中,确定所述待分类的文本所属的类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610354930.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种网页印象评论的方法及装置
- 下一篇:四合一功能艾灸盒(艾济天下)