[发明专利]基于RDF知识库的文本地域判断方法及其系统有效
申请号: | 201610955408.3 | 申请日: | 2016-10-27 |
公开(公告)号: | CN106570130B | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 李晟;段思欣;栾江霞;黄钦泉;章正道;王备战 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332 |
代理公司: | 深圳市博锐专利事务所 44275 | 代理人: | 张明 |
地址: | 361000 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于RDF知识库的文本地域判断方法及其系统,方法包括:构建关于地域信息的RDF知识库,并建立索引;预设地域区划的层级;预设地域相关名词的位置权重;获取文本中的地域相关名词;获取文本中所有地域相关名词各自对应的地域区划集合;分别计算地域区划集合中各地域区划对应一地域相关名词的第一分值;获取所有地域区划集合中各地域区划所对应的地域相关名词集合;将各地域区划的第一分值进行累加,得到地域区划的第二分值;根据第二分值,计算各地域区划为文本属地的概率。本发明在RDF知识库的基础上来实现文本的地域打标,提高方法的召回率,同时保证较高的准确率。 | ||
搜索关键词: | 基于 rdf 知识库 文本 地域 判断 方法 及其 系统 | ||
【主权项】:
1.一种基于RDF知识库的文本地域判断方法,其特征在于,包括:构建关于地域信息的RDF知识库,并建立索引,所述地域信息包括地域区划及其地域相关名词;预设地域区划的层级;根据地域相关名词在文本中的位置,预设地域相关名词的位置权重;获取文本中的地域相关名词;以一地域相关名词为关键词,在所述RDF知识库中搜索得到对应的地域区划集合,获取文本中所有地域相关名词各自对应的地域区划集合;根据地域相关名词对应的地域区划的个数、地域区划的层级、地域相关名词的位置权重和词频,以及搜索返回的地域相关名词与各地域区划的关联分值,分别计算地域区划集合中各地域区划对应所述一地域相关名词的第一分值;获取所有地域区划集合中各地域区划所对应的地域相关名词集合;将各地域区划对应所述地域相关名词集合内各地域相关名词的第一分值进行累加,得到所述地域区划的第二分值;根据所述第二分值,计算地域区划集合中各地域区划为文本属地的概率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610955408.3/,转载请声明来源钻瓜专利网。