[发明专利]一种关键词提取方法以及提取设备有效
申请号: | 201611222992.8 | 申请日: | 2016-12-26 |
公开(公告)号: | CN108241611B | 公开(公告)日: | 2021-08-17 |
发明(设计)人: | 贺达;孙德彬 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F16/953 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种关键词提取方法以及提取设备,用于更加准确的反映了真实的热门信息。本发明实施例方法包括:获取第一文本集合中各第一文本的关键词和第二文本集合中各第二文本的关键词,根据所述各第一文本的关键词得到第一数据;根据各第二文本的关键词得到第二数据,根据第一数据和第二数据计算第一关键词集合中各第一关键词的权重系数;基于第一关键词集合,根据权重系数确定目标关键词。本发明实施例还提供了一种提取设备。本发明实施例能够更加准确的反映了真实的热门信息。 | ||
搜索关键词: | 一种 关键词 提取 方法 以及 设备 | ||
【主权项】:
1.一种关键词提取方法,其特征在于,包括:提取设备获取第一文本集合中各第一文本的关键词和第二文本集合中各第二文本的关键词,所述各第一文本为发布时间在选定时间段内的文本,所述各第二文本为发布时间在选定历史时间段内的文本,所述选定时间段晚于所述选定历史时间段;所述提取设备根据所述各第一文本的关键词得到第一数据,所述第一数据包括第一关键词集合和各第一关键词对应的词频;所述提取设备根据所述各第二文本的关键词得到第二数据,所述第二数据包括第二关键词集合和各第二关键词对应的词频,所述第二关键词集合包括所述第一关键词集合的子集或全集;所述提取设备根据所述第一数据和所述第二数据计算所述第一关键词集合中各第一关键词的权重系数;基于所述第一关键词集合,所述提取设备根据所述权重系数确定目标关键词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611222992.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种文本流的在线主题检测方法和系统
- 下一篇:标点符号处理方法和装置