[发明专利]一种基于关键词提取分析的企业关系计算方法及系统有效

专利信息
申请号: 201710354039.7 申请日: 2017-05-18
公开(公告)号: CN107341142B 公开(公告)日: 2020-08-21
发明(设计)人: 辛柯俊 申请(专利权)人: 辛柯俊
主分类号: G06F40/289 分类号: G06F40/289;G06F40/30
代理公司: 北京中企鸿阳知识产权代理事务所(普通合伙) 11487 代理人: 郭鸿雁
地址: 210049 江苏省南*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出了一种基于关键词提取分析的企业关系计算方法及系统,包括:获取文本信息并获取文本信息包含的段落数;计算文本信中每个段落的字数,组装成新的文字段落;设定词典,并设置词典中的词语为引导词,根据设置的引导词对文本信息进行一次搜索,将文本中的语句在此摘录出一个新的文本;得到三个短语序列;分别设置对应的权重值,从三个短语序列中检查出重复词语,根据重复词语出现的次数与所在序列的权重值的乘积作为得分值,不重复的词语的得分值即为所在序列的权重值;将企业之间共同的关键短语作为连接点连接不同的企业。本发明计算企业之间的关联关系,将企业之间共同的关键短语作为连接点连接不同的企业,形成企业之间的关联关系。
搜索关键词: 一种 基于 关键词 提取 分析 企业 关系 计算方法 系统
【主权项】:
一种基于关键词提取分析的企业关系计算方法,其特征在于,包括如下步骤:步骤S1,获取文本信息T1,并获取所述文本信息包含的段落数;步骤S2,计算文本信息T1中每个段落的字数Cn以及所有段落的字数平均值CV,提取出Cn/CV大于等于某个阈值k的段落文字,组装成为一个新的文字段落T2;步骤S3,设定词典,并设置所述词典中的词语为引导词,根据设置的引导词对所述文本信息进行一次搜索,将文本中的语句在此摘录出一个新的文本T3;步骤S4,对所述T1、T2和T3分别提取关键短语,得到三个L1、L2和L3三个短语序列;步骤S5,将L1、L2和L3分别设置对应的权重值a、b和c,从三个短语序列中检查出重复词语,根据重复词语出现的次数与所在序列的权重值的乘积作为得分值,不重复的词语的得分值即为所在序列的权重值;步骤S6,将企业之间共同的关键短语作为连接点连接不同的企业,以形成企业之间的关联关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辛柯俊,未经辛柯俊许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710354039.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top