[发明专利]结合Redis内存数据库的分布式RDF关键词近似搜索方法有效
申请号: | 201610897778.6 | 申请日: | 2016-10-14 |
公开(公告)号: | CN106528648B | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 汪璟玢;陈远 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种结合Redis内存数据库的分布式RDF关键词近似搜索方法:首先结合RDF本体信息构建关键词集合对应的本体子图,利用语义评分函数对生成的本体子图进行排序;接着利用MapReduce计算框架实现分布式搜索,进行连接操作后返回Top‑k结果;如果返回的结果没有达到Top‑k,则对本体子图进行扩展,得到近似本体子图,再用语义相似度函数对近似本体子图进行排序,然后进行分布式近似搜索,直到返回Top‑k结果为止。本文算法解决了海量数据无法快速搜索和搜索效果不理想的问题,并且支持返回用户可能感兴趣的结果,具有深远的理论和实际意义。 | ||
搜索关键词: | 结合 redis 内存 数据库 分布式 rdf 关键词 近似 搜索 方法 | ||
【主权项】:
1.一种结合Redis内存数据库的分布式RDF关键词近似搜索方法,其特征在于,包括以下步骤:步骤S1:对RDF本体和RDF实例数据进行预处理,并生成相应的文件;步骤S2:结合Redis分布式数据库集群的特点,将步骤S1中生成的文件内容分门别类地存储在Redis数据库集群的Set集合中;步骤S3:根据RDF本体信息和输入的关键词集合Q,先把关键词映射成对应的类或属性,然后在本体图上找到类或属性匹配的模式三元组,对所述模式三元组进行三元组连接,生成关键词集合对应的本体子图;步骤S4:利用语义评分函数对构建的本体子图进行打分并排序,得分高的优先进行分布式搜索,跳到步骤S5;步骤S5:Map阶段搜索本体子图中各个模式三元组对应的实例三元组;步骤S6:Reduce阶段则将接收到的实例三元组进行连接,得到结果子图,并返回结果子图;步骤S7:判断结果子图中的实例三元组是否达到k条,如果已经达到,则结束搜索,跳到步骤S12,否则跳到步骤S8;步骤S8:判断是否还有本体子图没有进行分布式搜索,如果有,则跳到步骤S4,否则跳到步骤S9;步骤S9:判断是否有扩展后的近似本体子图未进行分布式搜索,如果有,则跳到步骤S11,否则跳到步骤S10;步骤S10:根据本体扩展规则按步骤S4中的排序对本体子图进行扩展并生成近似本体子图,跳到步骤S11;步骤S11:利用语义相似度函数对生成的近似本体子图进行打分并排序,得分高的优先进行分布式搜索,跳到步骤S5;步骤S12:算法结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610897778.6/,转载请声明来源钻瓜专利网。