[发明专利]一种链路预测模型的训练及链路预测方法有效
申请号: | 201610018320.9 | 申请日: | 2016-01-12 |
公开(公告)号: | CN106959967B | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 张艳;李太松;颜永红 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;H04L12/24;H04L12/751 |
代理公司: | 11472 北京方安思达知识产权代理有限公司 | 代理人: | 王宇杨;杨青<国际申请>=<国际公布>= |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种链路预测模型的训练方法,所述方法包括:步骤S1)对抓取网络数据进行预处理,将预处理后的网络数据提取训练集;步骤S2)对训练集构造的网络进行特征提取,将提取的特征组成特征集;所述特征包括:基于邻居的特征和基于网络游走的特征;步骤S3)对所述特征集用梯度迭代树模型进行特征转换,得到新的多维特征集;步骤S4)将特征集和新的多维特征集进行融合输入链路预测模型,训练得到所述链路预测模型的参数,从而得到训练完毕的链路预测模型。本发明的方法只需要从现有的特征集入手就能扩展特征集的数量;不需要再从网络中提取新的特征,极大地减少了特征提取难度;而且提升了模型的预测性能和鲁棒性。 | ||
搜索关键词: | 一种 预测 模型 训练 方法 | ||
【主权项】:
1.一种链路预测模型的训练方法,所述方法包括:/n步骤S1)对抓取网络数据进行预处理,将预处理后的网络数据提取训练集;/n步骤S2)对训练集构造的网络进行特征提取,将提取的特征组成特征集;所述特征包括:基于邻居的特征和基于网络游走的特征;/n步骤S3)对所述特征集用梯度迭代树模型进行特征转换,得到新的多维特征集;/n步骤S4)将所述特征集和新的多维特征集进行融合输入链路预测模型,训练得到所述链路预测模型的参数,从而得到训练完毕的链路预测模型;/n所述步骤S1)具体包括:/n步骤S1-1)从互联网中抓取大量的网络数据;/n所述网络数据中包含边的时间信息;/n步骤S1-2)若所抓取的网络数据进行预处理,所述预处理为删除包含孤立节点或节点对的网络数据;/n步骤S1-3)按时间先后顺序从预处理后的网络数据中提取训练集;/n从预处理的网络数据中选出相距为两跳的节点对,由于正负样本不均衡,需要对节点对进行采样,使得正负样本数量一致;采样后的样本经过标注后作为训练样本;所有训练样本的集合为训练集;/n所述步骤S3)的具体实现过程为:将所述特征集中的特征向量进行分类,然后分配到所述梯度迭代树模型的叶子节点上,直接取叶子节点的输出值作为新的多维特征集。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610018320.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种信息推荐方法及系统
- 下一篇:网站图标推广方法及装置