[发明专利]一种微博中特定用户的相似用户监控方法在审
申请号: | 201510363990.X | 申请日: | 2015-06-26 |
公开(公告)号: | CN105045822A | 公开(公告)日: | 2015-11-11 |
发明(设计)人: | 仲兆满;管燕 | 申请(专利权)人: | 淮海工学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 连云港润知专利代理事务所 32255 | 代理人: | 刘喜莲 |
地址: | 222000 江苏省连云港市海*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一种微博中特定用户的相似用户监控方法,其步骤如下:(1)根据输入的特定用户su得到扩展自我网络EEN(Extended Ego Network)的用户集,记为EEN(su)=FollowerCS(su)UFansCS(su)UVisitorCS(su),其中FollowerCS(su)为su的关注集,FansCS(su)为su的粉丝集,VisitorCS(su)为su的访客集;(2)基于用户的关注、粉丝和动态微博的相似度及用户间的动态交互相互性,从EEN(su)中发现与su相似的用户集SimUser(su)íEEN(su)。本发明方法引入了访客类用户,增加了发现相似用户的全面性和多样性;引入了时间的动态划分,能更好的体现微博的动态性,使得发现的相似用户更为准确。 | ||
搜索关键词: | 一种 微博中 特定 用户 相似 监控 方法 | ||
【主权项】:
一种微博中特定用户的相似用户监控方法,其特征在于,其步骤如下:A、根据输入的特定用户su得到扩展自我网络EEN——Extended Ego Network的用户集,记为EEN(su)=FollowerCS(su)UFansCS(su) UVisitorCS(su),其中FollowerCS(su)为su的关注集,FansCS(su)为su的粉丝集,VisitorCS(su)为su的访客集;其具体步骤如下:A1、获取时间片TimeSpan内用户su的所有微博集MB‑su,包括原创、转发、评论的微博;A2、获取su的关注集FollowerCS(su)和粉丝集FansCS(su);A3、根据su的微博集MB‑su提取访客集VisitorCS(su),将三类用户记为EEN(su)=FollowerCS(su)UFansCS(su) UVisitorCS(su);B、基于用户的关注、粉丝和动态微博的相似度,以及用户间的动态交互相互性,从EEN(su)中发现与su相似的用户集SimUser(su)íEEN(su),其具体步骤如下:B1、获取每个用户
在时间片TimeSpan内的微博集MB‑useri、关注集FollowerCS(useri)、粉丝集FansCS(useri);B2、计算用户su与
的动态微博相似度,记为MBSim(su,useri),
其中,Tj为某个时间片,Tj‑T1的计算结果为时间片相差个数,l为指数衰减参数,用户useri在Tj时间片的微博
向量化表示为:![]()
其中,
为特征项权重,使用TF*IDF方式计算,在时间片Tj两个用户su,useri的微博相似度使用余弦夹角方式计算:
B3、计算用户su与
的动态交互相关性,记为RC(su,useri),
其中,Tj为某个时间片,Tj‑T1的计算结果为时间片相差个数,l为指数衰减参数,在时间片Tj两个用户su,useri的交互相 关性为他们的交互次数,记为
m个时间片的最大交互次数记为RCmax,以RCmax为参考对用户的交互相关性进行归一化:
B4、计算用户su与
的关注相似度,记为FollowerSim(su,useri),
B5、计算用户su与
的粉丝相似度,记为FansSim(su,useri),
B6、最终得到用户su与
的相似度Sim(su,useri),![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮海工学院,未经淮海工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510363990.X/,转载请声明来源钻瓜专利网。