[发明专利]一种基于语义网无监督的自动问答方法有效
申请号: | 201510363362.1 | 申请日: | 2015-06-29 |
公开(公告)号: | CN104933031B | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 杨燕;杜泽宇;贺樑 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于语义网无监督的自动问答方法,该方法需要基于语义网的数据上实现,首先通过对用户问题进行同义转换和词干化,并利用语义网资源内部的数据进行三元组抽取,并找到语义网数据中最相关的实体和属性,生成对应的SPARQL语句查询,最终在支持语义网的用户终端中进行查询,本发明是在一个对基于语义网的自动问答的实现方案,无需复杂的训练预料和复杂的语义分析,只对语义网的文件自学习并利用同义词典进行同义转换,就能对跨领域的语义网知识库进行问答;其客观可行,并较之传统的问答方法能够回答复杂的知识问题。 | ||
搜索关键词: | 一种 基于 语义 监督 自动 问答 方法 | ||
【主权项】:
1.一种基于语义网无监督的自动问答方法,其特征在于,该方法要基于语义网的数据上实现,通过查询处理模块对用户问题进行同义转换和词干化,通过查询生成模块,生成对应的SPARQL语句查询,并在支持语义网的用户终端中进行查询,具体操作步骤:第一步:用户询问分词,提取词主干,并利用同义词典和语义网中的同义属性进行同义转换;第二步:查询语义网中与用户询问存在相关的三元组;第三步:利用字符相似度和同义词找出语义网中与问题中的词相似度高的实体;第四步:查询语义网中与匹配到的实体词有连接的数据;第五步:对于第二步至第四步生成的三元组组合成查询,并计算出与原始问题匹配值最高的sparql查询;具体为:第二步至第四步生成的三元组集合,任选K个三元组组合成如下所示查询Select distinct*{where P属于}并计依据:Ranting=∑0.1*(Common(Pi,W)/len(Wi))*sim(Wi,Pi),Wi表示原查询中的词,W是数据中的匹配词,Common(Wi,W)是两者的匹配字数,len(Wi)是查询词的长度,simi(Wi,Pi),是查询词与同义词的相似度,由词典直接给出;并依据上述公式计算出原始问题匹配值最高的sparql查询;第六步:利用Jena工具构建sparql查询终端,执行查询;第七步:结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510363362.1/,转载请声明来源钻瓜专利网。
- 上一篇:个人填表信息辅助翻译方法及装置
- 下一篇:中文地址分词标注方法