[发明专利]一种基于依存词汇关联度的形容词词义消歧方法在审

专利信息
申请号: 201610048601.9 申请日: 2016-01-26
公开(公告)号: CN105718443A 公开(公告)日: 2016-06-29
发明(设计)人: 鹿文鹏 申请(专利权)人: 齐鲁工业大学
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 暂无信息 代理人: 暂无信息
地址: 250353 山东省济南市西部*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及到一种基于依存词汇关联度的形容词词义消歧方法,属于自然语言处理技术领域。其步骤为:1.根据语义词典,收集目标形容词歧义词各个词义的同义词、近义词、反义词,构建相应词义的相关词集。2.对目标歧义词所在的句子进行依存句法分析,收集包含目标歧义词的形容词修饰及副词修饰依存元组,提取相应的依存共现词。3.对大规模语料进行依存句法分析,收集其中的依存共现词对,构建依存共现词对数据库DB。4.根据DB,计算目标歧义词的各个词义的依存词汇关联度。5.将整体依存词汇关联度最大的词义判定为正确词义。本发明的方法对比现有技术,能够准确地选择依存共现词,避免噪声词的干扰;能够自动构建依存共现词对数据库,无需任何人工辅助操作;能够改善形容词词义消歧的效果。
搜索关键词: 一种 基于 依存 词汇 关联 形容词 词义 方法
【主权项】:
一种基于依存词汇关联度的形容词词义消歧方法,其特征在于:其具体操作步骤为:步骤一、根据语义词典,收集目标形容词歧义词wt各个词义si的同义词、近义词、反义词,构建相应词义的相关词集Wsi;具体为:步骤1.1:根据WordNet,取词义概念si的同义词集;步骤1.2:根据WordNet,取词义概念si的近义词集;步骤1.3:根据WordNet,取词义概念si的反义词集;步骤1.4:将步骤1.1~1.3所得的同义词集、近义词集、反义词集合并,构建相应词义的相关词集Wsi;步骤二、对目标歧义词所在的句子进行依存句法分析,收集包含目标歧义词的形容词修饰及副词修饰依存元组,提取相应的依存共现词wamod和wadvmod;具体为:步骤2.1:利用依存句法分析工具对目标歧义词所在的句子进行依存句法分析,获取其依存元组集合;步骤2.2:由步骤2.1所得的依存元组集合,提取包含目标歧义词的形容词修饰及副词修饰依存元组;步骤2.3:由步骤2.2所得的依存元组,提取歧义词的依存共现实词wamod和wadvmod;步骤三、对大规模语料进行依存句法分析,收集其中的依存共现词对,构建依存共现词对数据库DB;具体为:步骤3.1:利用依存句法分析工具对大规模文本语料进行依存句法分析,获取其依存元组集合DSet;步骤3.2:舍弃DSet中依存元组的依存关系类型信息,统计依存共现词对,构建依存共现词对数据库DB;步骤四、根据DB,计算目标歧义词的各个词义的依存词汇关联度;具体为:步骤4.1:对于词义si的相关词集Wsi中的各个相关词wsi,由公式(1),计算其与wamod、wadvmod的依存词汇关联度,即relatedness(wamod,wsi)及relatedness(wsi, wadvmod);relatedness(w1,w2) = LLR(w1,w2) = 2[LogL(p1,a,a+b)+LogL(p2,c,c+d)‑LogL(p,a,a+b)‑LogL(p,c, c+d)]        (1)其中,;a = freq(w1,w2)表示支配词是w1,且从属词是w2的依存元组的总数;b = freq(w1,*) ‑ a表示支配词是w1,但从属词不是w2的依存元组的总数;c = freq(*,w2) ‑ a表示从属词是w2,但支配词不是w1的依存元组的总数;d = N ‑ a ‑ b ‑ c表示支配词不是w1并且从属词不是w2的依存元组的总数;N表示语料库所包含的全部依存元组的总数;步骤4.2:由公式(2),计算词义si与依存共现词wamod和wadvmod的整体依存词汇关联度;relatedness(si)= relatedness(wamod,Wsi)+relatedness(Wsi, wadvmod)         (2)其中,;Wsi表示由步骤一所获得的词义si的相关词集;步骤五、将整体依存词汇关联度最大的词义判定为正确词义;具体为:比较由步骤4.2所获得的各个词义的整体依存词汇关联度,将依存词汇关联度最大的词义判定为歧义词的正确词义;经过以上步骤的操作,即可判定形容词歧义词的词义,完成词义消歧任务。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610048601.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top