[发明专利]一种网络文本信息情感分类的方法在审
申请号: | 201610534277.1 | 申请日: | 2016-07-08 |
公开(公告)号: | CN106202372A | 公开(公告)日: | 2016-12-07 |
发明(设计)人: | 姚春华;杨颖;唐明芳;陈小玉;鄢秋霞 | 申请(专利权)人: | 中国电子科技网络信息安全有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 邓世燕 |
地址: | 610207 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种网络文本信息情感分类的方法,包括如下步骤:步骤一、首先判断文档是否属于新闻,如果属于新闻则只提取标题进行情感分类,否则则对整个文档进行情感分类;步骤二、对需要分类的文档进行预处理;步骤三、根据文本长短对文档进行分类:对长度大于140个字符的文档采用TF‑IDF计算特征权重然后利用训练好的逻辑回归分类器进行分类;对长度小于140个字符的文档采用人工情感分类规则进行分类。与现有技术相比,本发明的积极效果是:本发明方法针对长文本、短文本的不同特点,采用机器学习算法构建分类器与领域专家制定分类特征相结合的技术路线,能够准确及时地发现网络舆情中涉及到的反动信息、敏感信息以及负面信息。 | ||
搜索关键词: | 一种 网络 文本 信息 情感 分类 方法 | ||
【主权项】:
一种网络文本信息情感分类的方法,其特征在于:包括如下步骤:步骤一、首先判断文档是否属于新闻,如果属于新闻则只提取标题进行情感分类,否则则对整个文档进行情感分类;步骤二、对需要分类的文档进行预处理;步骤三、根据文本长短对文档进行分类:(一)对长度大于140个字符的文档采用TF‑IDF计算特征权重然后利用训练好的逻辑回归分类器进行分类;(二)对长度小于140个字符的文档采用人工情感分类规则进行分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技网络信息安全有限公司,未经中国电子科技网络信息安全有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610534277.1/,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置