[发明专利]基于语义小世界模型的文献检索方法无效
申请号: | 200710051607.2 | 申请日: | 2007-03-02 |
公开(公告)号: | CN101017504A | 公开(公告)日: | 2007-08-15 |
发明(设计)人: | 金海;宁小敏;袁平鹏;武浩;余一娇 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 华中科技大学专利中心 | 代理人: | 曹葆青 |
地址: | 430074湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于语义小世界模型的文献检索方法,先利用潜在语义索引提取文献特征向量,在尽量保留文献特征的前提下降低其维数,减少文献信息存储量;再利用支持向量机对节点的所有共享文献进行分类,形成分类信息,该分类信息标志该节点对文献类别的兴趣比例;最后利用社会网络中的小世界现象,使对等网络中的所有节点都具有直接相连的较少的与其兴趣相似的短链接节点,同时具有极少的在某一种文献类别的兴趣比例非常高的长链接,形成具有语义小世界特征的网络拓扑。本发明特点是查询消息被路由到最有可能回答该请求的节点,提高查询效率;充分利用长链接,使查询语句能很快路由到网络其他部分,提高查全率,减少网络负载。 | ||
搜索关键词: | 基于 语义 世界 模型 文献 检索 方法 | ||
【主权项】:
1、一种基于语义小世界模型的文献检索方法,包括如下步骤:(1)建立全局的具有语义小世界特征的网络拓扑结构,其步骤包括:(1.1)利用潜在语义索引方法提取文献特征向量,该文献特征向量包括文献中单词出现的频率以及在所有待提取特征向量的文献集合中出现的次数;(1.2)在上述文献特征向量基础上,支持向量机对训练文献进行有指导的学习,获取支持向量模型;(1.3)对等网络中的每个节点在获得以上向量模型后,对本节点的所有共享文献进行分类,形成分类信息,该分类信息标志该节点文献类别的兴趣比例;(1.4)每个节点在两个跳的范围内选择文献类别的兴趣比例相似的节点,选择的标准是相似度超过预定的相似度阈值;(1.5)如果网络中部分节点在某一种文献类别的兴趣比例非常高,超过预定的阈值,则该节点设置成具有可能被其他节点直接链接的超级语义节点;(1.6)所有节点在超过两个跳的范围外与超级语义节点以概率p直接链接,其中0<p≤0.001;(2)在建立具有语义小世界特征的网络拓扑基础上,进行文献信息检索,其步骤包括:(2.1)节点发出查询请求,每个查询语句包括查询关键字和查询的文献类别;(2.2)如果查询的文献类别属于发出该查询语句的节点的文献类别,且其比例大于50%,则跳入步骤(2.3);否则,跳入步骤(2.5);(2.3)节点进行本地查询,返回查询结果;(2.4)将该查询语句转发给该节点的每个短链接节点;并对每个长链接节点,如果其最高兴趣比例的文献类别与查询语句的文献类别一致,则转发给该长链接节点,并跳入步骤(2.6),否则直接跳入步骤(2.6);(2.5)将查询语句转发给该节点的每个物理直接相连的邻居节点;并对每个长链接节点,如果其最高兴趣比例的文献类别与查询语句的文献类别一致,则转发给该长链接节点;跳入步骤(2.6);(2.6)查询结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200710051607.2/,转载请声明来源钻瓜专利网。