[发明专利]一种基于词向量模型的文学作品竞猜方法有效

申请号：	201610439566.3	申请日：	2016-06-17
公开（公告）号：	CN106095758B	公开（公告）日：	2018-12-04
发明（设计）人：	王庆林;李原;刘禹;阮海鹏	申请（专利权）人：	北京理工大学
主分类号：	G06F17/27	分类号：	G06F17/27
代理公司：	北京理工正阳知识产权代理事务所(普通合伙) 11639	代理人：	唐华
地址：	100081 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于词向量模型的文学作品竞猜方法，属于信息处理技术领域，包括文学作品知识库构建和文学作品知识竞猜两个阶段。在构建阶段：收集特定文学作品小规模语料，从中挖掘出该文学作品特征词；利用该小规模语料训练词向量神经网络得到词向量关联模型；基于该模型计算与每个特征词关联度较高的相关词，从而构建出文学作品竞猜知识库。在竞猜阶段：系统随机选择一个特征词作为竞猜对象，从知识库中抽取该特征词的相关词并依次向竞猜者公示，竞猜者进行推理答题。本发明利用词向量模型分析方法发现特定文学作品的特征词关联关系，并以竞猜形式考察读者对文学作品的熟悉程度，在增强文学作品与读者之间互动的同时，提高了阅读的趣味性。
搜索关键词：	一种基于向量模型文学作品竞猜方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于词向量模型的文学作品竞猜方法，其特征在于，该方法包括文学作品知识库构建和文学作品知识竞猜两个阶段，具体包括如下步骤：步骤101，收集特定文学作品的相关文字语料，包括但不限于文学作品原著、与该文学作品有关的百科知识词条和相关研究文档，构建特定文学作品的小规模语料库；步骤102，对构建好的文学作品小规模语料库进行自然语言文本预处理工作，去除不相关文本噪音；步骤103，对去噪音后的小规模语料库采用自然语言处理工具或方法进行命名实体识别，将得到的命名实体作为该文学作品特有的特征词添加到特征词词表中；步骤104，将特征词词表中的全部特征词添加到分词工具的分词词典中，使用分词词典对特定文学作品小规模语料库进行分词，得到分词后语料，并将分词后语料的所有词语无重复的添加到词汇表中；步骤105，结合词向量分析工具，使用分词后语料作为输入得到该文学作品小规模语料的词向量模型，并计算与每个特征词最相关的一组相关词，构建文学作品竞猜知识库；步骤106，进入文学作品知识竞猜阶段，系统随机选择一个特征词作为竞猜对象，并从文学作品竞猜知识库中抽取该特征词关联度最高的前N个相关词；步骤107，将步骤106中保留的N个相关词分为M组，每组分别有不少于2个相关词，依据关联度大小为不同组别设定难度级别；步骤108，系统从M组中各随机抽取出一个相关词，并按照关联度排序从低到高依次向竞猜者公示；步骤109，竞猜者根据已公示的相关词进行推理答题，系统判断其回答正确则记录公示时间，同时进入下一题；在相关词消失时仍然答错或不答，则记录为失败，同时进入下一题；步骤110，在竞猜者回答一定数量的问题后，竞猜结束，系统根据竞猜者答题过程中花费的时间、正确率进行综合评价，并给出得分，以此反映竞猜者对该文学作品的熟悉程度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京理工大学，未经北京理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610439566.3/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于词向量模型的文学作品竞猜方法有效

专利文献下载