[发明专利]一种基于关键词提取分析的企业关系计算方法及系统有效
申请号: | 201710354039.7 | 申请日: | 2017-05-18 |
公开(公告)号: | CN107341142B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 辛柯俊 | 申请(专利权)人: | 辛柯俊 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30 |
代理公司: | 北京中企鸿阳知识产权代理事务所(普通合伙) 11487 | 代理人: | 郭鸿雁 |
地址: | 210049 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于关键词提取分析的企业关系计算方法及系统,包括:获取文本信息并获取文本信息包含的段落数;计算文本信中每个段落的字数,组装成新的文字段落;设定词典,并设置词典中的词语为引导词,根据设置的引导词对文本信息进行一次搜索,将文本中的语句在此摘录出一个新的文本;得到三个短语序列;分别设置对应的权重值,从三个短语序列中检查出重复词语,根据重复词语出现的次数与所在序列的权重值的乘积作为得分值,不重复的词语的得分值即为所在序列的权重值;将企业之间共同的关键短语作为连接点连接不同的企业。本发明计算企业之间的关联关系,将企业之间共同的关键短语作为连接点连接不同的企业,形成企业之间的关联关系。 | ||
搜索关键词: | 一种 基于 关键词 提取 分析 企业 关系 计算方法 系统 | ||
【主权项】:
一种基于关键词提取分析的企业关系计算方法,其特征在于,包括如下步骤:步骤S1,获取文本信息T1,并获取所述文本信息包含的段落数;步骤S2,计算文本信息T1中每个段落的字数Cn以及所有段落的字数平均值CV,提取出Cn/CV大于等于某个阈值k的段落文字,组装成为一个新的文字段落T2;步骤S3,设定词典,并设置所述词典中的词语为引导词,根据设置的引导词对所述文本信息进行一次搜索,将文本中的语句在此摘录出一个新的文本T3;步骤S4,对所述T1、T2和T3分别提取关键短语,得到三个L1、L2和L3三个短语序列;步骤S5,将L1、L2和L3分别设置对应的权重值a、b和c,从三个短语序列中检查出重复词语,根据重复词语出现的次数与所在序列的权重值的乘积作为得分值,不重复的词语的得分值即为所在序列的权重值;步骤S6,将企业之间共同的关键短语作为连接点连接不同的企业,以形成企业之间的关联关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辛柯俊,未经辛柯俊许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710354039.7/,转载请声明来源钻瓜专利网。