[发明专利]一种关联频度计算的基于数据图谱、信息图谱和知识图谱框架的语义建模方法有效

专利信息
申请号: 201710394911.0 申请日: 2017-05-30
公开(公告)号: CN107038262B 公开(公告)日: 2019-07-23
发明(设计)人: 段玉聪;邵礼旭 申请(专利权)人: 海南大学
主分类号: G06F16/36 分类号: G06F16/36;G06F17/27;G06N5/02
代理公司: 暂无信息 代理人: 暂无信息
地址: 570228 海*** 国省代码: 海南;46
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明是一种关联频度计算的基于数据图谱、信息图谱和知识图谱框架的语义建模及抽象增强方法,主要用于从初始需求描述和应用场景中获得合理的类及对象图,属于分布式计算和软件工程学技术交叉领域。在数据图谱上表达离散的实体、对象、属性和操作,记录每个实体、对象、属性或操作的频度,包括结构频度、时间频度和空间频度;在信息图谱上标记结点间的交互关系,计算交互频度即交互次数,当交互频度大于设定阈值时集成多个结点,产生的新结点作为实体继续标记结构频度、时间频度和空间频度;在知识图谱上对类之间的关系运用关系抽象规则进一步抽象,并可对需求表达的完整性进行补充,提升开发效率。
搜索关键词: 一种 关联 频度 计算 基于 数据 图谱 信息 知识 框架 语义 建模 抽象 增强 方法
【主权项】:
1.一种关联频度计算的基于数据图谱、信息图谱和知识图谱框架的语义建模方法,其所包含的步骤如下:步骤1)获取用户需求描述,需求由一个或多个用户来描述,多源的需求存在冗余性和不一致性,如果开发者以研究的方式收集用户的需求,用户群体会非常大,用户对需求的描述将会非常混乱;步骤2)基于步骤1得到的需求描述,提取关键词并将关键词以结点的形式表达在数据图谱上,记录每种关键词出现的结构频度Str_f、时间频度Tem_f和空间频度Spa_f,定义结构频度为数据出现在不同数据结构中的次数,限定每次计算在内的数据结构必须是数据所在最大数据结构;时间频度为数据在不同时间出现的次数,空间频度被定义为数据在不同空间位置出现的次数;步骤3)基于步骤2中记录的数据的结构频度、时间频度和空间频度,将时间频度为1的结点标记为对象,并根据公式1计算数据的总频度frequency:步骤4)基于步骤3得到的数据的总频度,根据公式2和公式3计算数据在数据图谱上的支持度support(ri)和置信度confidency以删除错误或无用数据,FrequencyDG表示数据图谱上所有结点的频度总和,ri、rj是指两个不同的结点,删除数据的条件是必须同时满足支持度和置信度的阈值要求,阈值过大不利于图谱表达的准确性,过小会不利于表达的完整性,根据计算图谱反馈的支持度和置信度信息动态调整数据图谱结构:步骤5)基于步骤4)得到的数据图谱,统一含义相同但表达方式不同的数据,减少小频率出现的数据;步骤6)基于步骤5)得到的数据图谱,对图谱上结点表示的关键词进行词性分析,将名词和名词短语当作属性或类,将动词或动词短语当作操作;步骤7)基于步骤6得到的信息图谱,根据公式4计算结点间交互的频度,结点间交互的频度表示结点之间交互的次数,E1、E2是指计算过程中任意的两个计算结点,P表示结点之间所有完整的交互路径:   (4)步骤8)基于步骤7得到的信息图谱,根据公式5计算有交互关系的多个结点的综合频度Totalfrequency, FrequencyDG表示存在交互关系的结点在数据图谱上的频度之和,FrequencyIG表示实体在信息图谱上的交互频度,α和β是数据图谱频度和信息图谱频度所占权重,可由训练得出:步骤9)基于步骤8得到的信息图谱,计算连通结点的内聚性,根据公式6将实体内聚性确定为内部交互度和外部交互度的比值,DegreeEI表示圈定范围后的实体集与外部实体之间的交互,DegreeII表示圈定实体之间的内部交互,在外部交互度和内部交互度的计算中,忽略了实体之间的关系方向,计算多次后将具有最大的实体内聚性cohesion的不同连通实体以属性和操作的形式集成,在信息图谱上以新结点的形式表达,增强模型的内聚性并提高抽象度:步骤10)基于步骤9得到的信息图谱,转到数据图谱上标记新产生的结点的结构频度、时间频度和空间频度;步骤11)基于步骤10)得到的信息图谱,完善实体之间的语义关系,结点之间存在选择关系、序列关系、并行关系、互斥关系以及逻辑关系,在知识图谱上能通过信息推理和实体链接提高知识图谱的边密度和结点密度,知识图谱的无结构特性使得其自身无缝链接,信息推理需要有相关关系规则的支持,通过推理得到的新关系的正确度Cr根据公式7进行计算,π表示实体1和实体2之间的一条路径,Q(E1→E2)表示实体E1和实体E2之间的所有路径,R表示两实体之间的关系,Q表示所有路径,θ(π)表示训练权重,当正确度超过某一设定阈值时认为该关系成立:  (7)步骤12)基于步骤11得到的知识图谱,查找结点之间的关系是否有成环的现象,若有,根据关系抽象规则,对知识图谱进行简化,删掉冗余的连接关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南大学,未经海南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710394911.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top