[发明专利]结合Redis内存数据库的分布式RDF关键词近似搜索方法有效

专利信息
申请号: 201610897778.6 申请日: 2016-10-14
公开(公告)号: CN106528648B 公开(公告)日: 2019-10-15
发明(设计)人: 汪璟玢;陈远 申请(专利权)人: 福州大学
主分类号: G06F16/2458 分类号: G06F16/2458
代理公司: 福州元创专利商标代理有限公司 35100 代理人: 蔡学俊
地址: 350108 福建省福州市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种结合Redis内存数据库的分布式RDF关键词近似搜索方法:首先结合RDF本体信息构建关键词集合对应的本体子图,利用语义评分函数对生成的本体子图进行排序;接着利用MapReduce计算框架实现分布式搜索,进行连接操作后返回Top‑k结果;如果返回的结果没有达到Top‑k,则对本体子图进行扩展,得到近似本体子图,再用语义相似度函数对近似本体子图进行排序,然后进行分布式近似搜索,直到返回Top‑k结果为止。本文算法解决了海量数据无法快速搜索和搜索效果不理想的问题,并且支持返回用户可能感兴趣的结果,具有深远的理论和实际意义。
搜索关键词: 结合 redis 内存 数据库 分布式 rdf 关键词 近似 搜索 方法
【主权项】:
1.一种结合Redis内存数据库的分布式RDF关键词近似搜索方法,其特征在于,包括以下步骤:步骤S1:对RDF本体和RDF实例数据进行预处理,并生成相应的文件;步骤S2:结合Redis分布式数据库集群的特点,将步骤S1中生成的文件内容分门别类地存储在Redis数据库集群的Set集合中;步骤S3:根据RDF本体信息和输入的关键词集合Q,先把关键词映射成对应的类或属性,然后在本体图上找到类或属性匹配的模式三元组,对所述模式三元组进行三元组连接,生成关键词集合对应的本体子图;步骤S4:利用语义评分函数对构建的本体子图进行打分并排序,得分高的优先进行分布式搜索,跳到步骤S5;步骤S5:Map阶段搜索本体子图中各个模式三元组对应的实例三元组;步骤S6:Reduce阶段则将接收到的实例三元组进行连接,得到结果子图,并返回结果子图;步骤S7:判断结果子图中的实例三元组是否达到k条,如果已经达到,则结束搜索,跳到步骤S12,否则跳到步骤S8;步骤S8:判断是否还有本体子图没有进行分布式搜索,如果有,则跳到步骤S4,否则跳到步骤S9;步骤S9:判断是否有扩展后的近似本体子图未进行分布式搜索,如果有,则跳到步骤S11,否则跳到步骤S10;步骤S10:根据本体扩展规则按步骤S4中的排序对本体子图进行扩展并生成近似本体子图,跳到步骤S11;步骤S11:利用语义相似度函数对生成的近似本体子图进行打分并排序,得分高的优先进行分布式搜索,跳到步骤S5;步骤S12:算法结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610897778.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top