[发明专利]一种基于信任关联度的微博网络社区发现方法在审

专利信息
申请号: 201510439245.9 申请日: 2015-07-23
公开(公告)号: CN105159918A 公开(公告)日: 2015-12-16
发明(设计)人: 刘玲;杨长春;顾寰;吕晨 申请(专利权)人: 常州大学
主分类号: G06F17/30 分类号: G06F17/30;G06Q50/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 213164 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 目前,现有的社交网络快速划分社区算法存在质量低、不能充分利用节点链接信息的问题,而效果较好的划分算法也存在时间复杂度高、无法应用于大规模社交网络的问题。为此,提出了基于信任关联度的微博网络社区发现算法。在定义社区节点对信息群度、动态分配网络边权重值的基础上,计算节点的信任关联度矩阵,再通过改进的K-medoids算法对节点进行聚类分析,通过计算社区数的LC模块度确定网络社区的理想结构。在新浪微博数据集上进行实验,结果表明,该算法能使得社区的划分结果更准确。
搜索关键词: 一种 基于 信任 关联 网络 社区 发现 方法
【主权项】:
一种基于信任关联度的微博网络社区发现方法,其特征在于包括以下步骤:101、获取微博数据来定义节点的信息群度,具体包括以下步骤:Al、根据节点的原创微博数oij、微博转发数rij来计算出节点之间的活跃值aij,其中有aij=(β1×oij2×rij)/n;Bl、根据节点之间的评论数为cij、赞数为lij,微博总数n来计算出节点之间的博文质量值qij,其中有qij=(λ1×cij2×lij)/n;Cl、将节点之间边权重wij的值设为节点对的信息群度,即dij=1/(aij+qij)wij=dij102、根据101中求得的信息群度来计算节点之间的信任关联度,具体包括以下步骤:A2、由于节点i与j之间的节点对的信息群度越小,它们的信任关联度就越大,定义两个相邻节点vi、vj的信任关联度:node Relation(vi,vj)=1‑wijB2、利用深度优先搜索算法求得图中所有的非相邻节点之间的最短路径,然后再求出非相邻节点之间的最大信任关联度。假设微博网络中非相邻节点vi和节点vj之间的最短路径为shortPath(vi,vj)={(vi,vk),(vk,vm),...,(vn,vj)},如果非相邻节点间的最短路径数为s,则选择其中乘积最大的作为非相邻节点的信任关联度,即<mrow><mi>n</mi><mi>o</mi><mi>d</mi><mi>e</mi><mi> </mi><mi>Re</mi><mi>l</mi><mi>a</mi><mi>t</mi><mi>i</mi><mi>o</mi><mi>n</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>,</mo><msub><mi>v</mi><mi>j</mi></msub><mo>)</mo></mrow><mo>=</mo><munder><mrow><mi>m</mi><mi>a</mi><mi>x</mi></mrow><mi>s</mi></munder><mo>{</mo><munder><mi>&Pi;</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>,</mo><msub><mi>v</mi><mi>k</mi></msub><mo>)</mo><mo>&Element;</mo><mi>s</mi><mi>h</mi><mi>o</mi><mi>r</mi><mi>t</mi><mi>P</mi><mi>a</mi><mi>t</mi><mi>h</mi><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>,</mo><msub><mi>v</mi><mi>j</mi></msub><mo>)</mo></mrow></munder><mi>n</mi><mi>o</mi><mi>d</mi><mi>e</mi><mi> </mi><mi>Re</mi><mi>l</mi><mi>a</mi><mi>t</mi><mi>i</mi><mi>o</mi><mi>n</mi><mrow><mo>(</mo><msub><mi>v</mi><mi>i</mi></msub><mo>,</mo><msub><mi>v</mi><mi>k</mi></msub><mo>)</mo></mrow><mo>}</mo></mrow>C2、根据A2、B2可以构造微博网络的节点信任关联度矩阵R,即R=[node Relation(vi,vj)]|V|×|V|D2、由于R是一个对称矩阵,根据节点与其自身的信任关联度值为1,因此为了计算方便,将矩阵R主对角线上的元素值设为相应节点的度,即103、在101、102的基础上再采用LC模块度,它与社区的连接密度和内聚系数相关,具体包括以下步骤:A3、假设有某种划分形式,将网络G划分为S1,S2,…,Sn。首先,计算社区Si的连接密度L(Si),其中,ni表示社区Si的节点数;E(Si)表示社区Si内部的边数,即<mrow><mi>L</mi><mrow><mo>(</mo><msub><mi>S</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mfenced open = '{' close = ''><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mrow><msub><mi>n</mi><mi>i</mi></msub><mo>=</mo><mn>1</mn></mrow></mtd></mtr><mtr><mtd><mfrac><mrow><mn>2</mn><mi>E</mi><mrow><mo>(</mo><msub><mi>S</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><msub><mi>n</mi><mi>i</mi></msub><mrow><mo>(</mo><msub><mi>n</mi><mi>i</mi></msub><mo>-</mo><mn>1</mn><mo>)</mo></mrow></mrow></mfrac></mtd><mtd><mrow><msub><mi>n</mi><mi>i</mi></msub><mo>&gt;</mo><mn>1</mn></mrow></mtd></mtr></mtable></mfenced></mrow>B3、然后,计算社区Si的内聚系数Coh(Si),其中,i≠j,并且A(Si,Sj)表示连接社区Si和Sj之间的边的总数,即<mrow><mi>C</mi><mi>o</mi><mi>h</mi><mrow><mo>(</mo><msub><mi>S</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mfenced open = '{' close = ''><mtable><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mi>E</mi><mrow><mo>(</mo><msub><mi>S</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>=</mo><mn>1</mn></mrow></mtd></mtr><mtr><mtd><mfrac><mrow><mi>E</mi><mrow><mo>(</mo><msub><mi>S</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><mi>E</mi><mrow><mo>(</mo><msub><mi>S</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>+</mo><munder><mi>&Sigma;</mi><mrow><mi>j</mi><mo>&NotEqual;</mo><mn>1</mn></mrow></munder><mi>A</mi><mrow><mo>(</mo><msub><mi>S</mi><mi>i</mi></msub><mo>,</mo><msub><mi>S</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow></mfrac></mtd><mtd><mrow><mi>E</mi><mrow><mo>(</mo><msub><mi>S</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>&gt;</mo><mn>1</mn></mrow></mtd></mtr></mtable></mfenced></mrow>C3、在A3、B3的基础上计算LC模块度Q(S1,S2,...,Sn),即<mrow><mi>Q</mi><mrow><mo>(</mo><msub><mi>S</mi><mn>1</mn></msub><mo>,</mo><msub><mi>S</mi><mn>2</mn></msub><mo>,</mo><mo>...</mo><mo>,</mo><msub><mi>S</mi><mi>n</mi></msub><mo>)</mo></mrow><mo>=</mo><mfenced open = '{' close = ''><mtable><mtr><mtd><mn>0</mn></mtd><mtd><mrow><mi>n</mi><mo>=</mo><mn>0</mn></mrow></mtd></mtr><mtr><mtd><mfrac><mrow><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><mi>L</mi><mrow><mo>(</mo><msub><mi>S</mi><mi>i</mi></msub><mo>)</mo></mrow><mi>C</mi><mi>o</mi><mi>h</mi><mrow><mo>(</mo><msub><mi>S</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mi>n</mi></mfrac></mtd><mtd><mrow><mi>n</mi><mo>&gt;</mo><mn>1</mn></mrow></mtd></mtr></mtable></mfenced></mrow>D3、再用改进的K‑medoids算法对节点进行聚类,首先为每个簇随意选择一个代表对象,剩余的对象根据其与代表对象的距离分配给最近的一个簇,以簇类各个节点轮换为相应的聚类中心,最后得出最大的LC模块度值对应社区划分的最佳结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州大学,未经常州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510439245.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top