[发明专利]推送热词的方法及装置有效
申请号: | 201611121628.2 | 申请日: | 2016-12-07 |
公开(公告)号: | CN108170693B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 孙中秋 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种推送热词的方法及装置。该方法包括:获取用户访问行为数据,其中,用户访问行为数据为多个用户访问目标网站产生的数据,用户访问行为数据包括多个用户ID和多个检索关键词,检索关键词为通过用户ID在目标网站上进行检索的关键词;对用户访问行为数据进行去重处理,得到去重后的用户访问行为数据;根据去重后的用户访问行为数据中多个用户ID确定去重后的用户访问行为数据中每个检索关键词的关联度;以及在目标网站上根据关联度进行热词推送。通过本申请,解决了相关技术中基于用户检索关键词的词频高低为用户推送热词的准确性较低的问题。 | ||
搜索关键词: | 推送 方法 装置 | ||
获取用户访问行为数据,其中,所述用户访问行为数据为多个用户访问目标网站产生的数据,所述用户访问行为数据包括多个用户ID和多个检索关键词,所述检索关键词为通过所述用户ID在所述目标网站上进行检索的关键词;
对所述用户访问行为数据进行去重处理,得到去重后的用户访问行为数据;
根据所述去重后的用户访问行为数据中多个用户ID确定所述去重后的用户访问行为数据中每个检索关键词的关联度;以及
在所述目标网站上根据所述关联度进行热词推送。
2.根据权利要求1所述的方法,其特征在于,根据所述去重后的用户访问行为数据中多个用户ID确定所述去重后的用户访问行为数据中每个检索关键词的关联度包括:根据所述去重后的用户访问行为数据中的检索关键词建立邻接矩阵;
在所述邻接矩阵中根据所述去重后的用户访问行为数据中的用户ID确定所述去重后的用户访问行为数据中的第一检索关键词与所述去重后的用户访问行为数据中的第二检索关键词之间是否存在关联关系;
如果所述第一检索关键词与所述第二检索关键词之间存在关联关系,将所述第一检索关键词和所述第二检索关键词之间的关联度记录为第一标记;以及
如果所述第一检索关键词与所述第二检索关键词之间不存在关联关系,将所述第一检索关键词和所述第二检索关键词之间的关联度记录为第二标记。
3.根据权利要求2所述的方法,其特征在于,在所述目标网站上根据所述关联度进行热词推送包括:根据所述每个检索关键词的关联度计算所述每个检索关键词的中心度,其中,所述中心度根据所述每个检索关键词记录的第一标记的个数除以关联度总和得到,所述关联度总和为所述邻接矩阵中记录的所有第一标记个数的总和;以及
在所述目标网站上根据所述中心度进行热词推送。
4.根据权利要求3所述的方法,其特征在于,在所述目标网站上根据所述关联度进行热词推送包括:对所述每个检索关键词的中心度由高到低进行排序;
按照预设规则获取N个排序后的检索关键词,其中,所述N为预设数值;
判断所述N个排序后的检索关键词中是否存在中心度相同的检索关键词;
如果所述N个排序后的检索关键词中不存在所述中心度相同的检索关键词,按照所述N个排序后的检索关键词的中心度由高到低进行检索关键词推送;以及
如果所述N个排序后的检索关键词中存在所述中心度相同的检索关键词,对所述中心度相同的检索关键词按照预设规则进行检索关键词推送。
5.根据权利要求4所述的方法,其特征在于,如果所述N个排序后的检索关键词中存在所述中心度相同的检索关键词,对所述中心度相同的检索关键词按照预设规则进行检索关键词推送包括:确定所述中心度相同的检索关键词被用户检索的次数;以及
对于所述中心度相同的检索关键词按照所述被用户检索的次数由高到低进行检索关键词推送。
6.一种推送热词的装置,其特征在于,包括:获取单元,用于获取用户访问行为数据,其中,所述用户访问行为数据为多个用户访问目标网站产生的数据,所述用户访问行为数据包括多个用户ID和多个检索关键词,所述检索关键词为通过所述用户ID在所述目标网站上进行检索的关键词;
处理单元,用于对所述用户访问行为数据进行去重处理,得到去重后的用户访问行为数据;
确定单元,用于根据所述去重后的用户访问行为数据中多个用户ID确定所述去重后的用户访问行为数据中每个检索关键词的关联度;以及
推送单元,用于在所述目标网站上根据所述关联度进行热词推送。
7.根据权利要求6所述的装置,其特征在于,所述确定单元包括:建立模块,用于根据所述去重后的用户访问行为数据中的检索关键词建立邻接矩阵;
第一判断模块,用于在所述邻接矩阵中根据所述去重后的用户访问行为数据中的用户ID确定所述去重后的用户访问行为数据中的第一检索关键词与所述去重后的用户访问行为数据中的第二检索关键词之间是否存在关联关系;
第一记录模块,用于在所述第一检索关键词与所述第二检索关键词之间存在关联关系的情况下,将所述第一检索关键词和所述第二检索关键词之间的关联度记录为第一标记;以及
第二记录模块,用于在所述第一检索关键词与所述第二检索关键词之间不存在关联关系的情况下,将所述第一检索关键词和所述第二检索关键词之间的关联度记录为第二标记。
8.根据权利要求7所述的装置,其特征在于,所述推送单元包括:计算模块,用于根据所述每个检索关键词的关联度计算所述每个检索关键词的中心度,其中,所述中心度根据所述每个检索关键词记录的第一标记的个数除以关联度总和得到,所述关联度总和为所述邻接矩阵中记录的所有第一标记个数的总和;以及
第一推送模块,用于在所述目标网站上根据所述中心度进行热词推送。
9.根据权利要求8所述的装置,其特征在于,所述推送单元包括:排序模块,用于对所述每个检索关键词的中心度由高到低进行排序;
获取模块,用于按照预设规则获取N个排序后的检索关键词,其中,所述N为预设数值;
第二判断模块,用于判断所述N个排序后的检索关键词中是否存在中心度相同的检索关键词;
第二推送模块,用于在所述N个排序后的检索关键词中不存在所述中心度相同的检索关键词的情况下,按照所述N个排序后的检索关键词的中心度由高到低进行检索关键词推送;以及
第三推送模块,用于在所述N个排序后的检索关键词中存在所述中心度相同的检索关键词的情况下,对所述中心度相同的检索关键词按照预设规则进行检索关键词推送。
10.根据权利要求9所述的装置,其特征在于,所述第三推送模块包括:确定子模块,用于确定所述中心度相同的检索关键词被用户检索的次数;以及
推送子模块,用于对于所述中心度相同的检索关键词按照所述被用户检索的次数由高到低进行检索关键词推送。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611121628.2/,转载请声明来源钻瓜专利网。