[发明专利]微博热点话题分析方法无效
申请号: | 201310284081.8 | 申请日: | 2013-07-08 |
公开(公告)号: | CN104281607A | 公开(公告)日: | 2015-01-14 |
发明(设计)人: | 肖江;严时浪;肖伦文 | 申请(专利权)人: | 上海锐英软件技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201207 上海市浦东新区张江高科技*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种微博热点话题分析方法,其包括以下步骤:微博采集模块根据采集策略,使用网络爬虫与微博第三方api技术相结合的方式获取微博数据;利用分词处理技术从词库中调用关键词和敏感词,从微博文本数据中分析出关键词和敏感词;依据分析出的关键词、敏感词以及情感倾向词对微博网页文本数据进行过滤;热点话题模块通过聚类分析技术将##与[]符号之间括住的内容,标记为一个话题,以统计微博评论数;热点人物模块通过聚类分析技术以分析微博粉丝数量、评论数量;微博预警模块从网络微博中分析出与关键字和敏感词有关的微博信息;分析统计模块对系统中分析出的相关数据自动生成简报。本发明提高了话题分析的准确性,提高了检测效率。 | ||
搜索关键词: | 热点话题 分析 方法 | ||
【主权项】:
一种微博热点话题分析方法,其特征在于,所述微博热点话题分析方法包括以下步骤:步骤一,微博采集模块根据采集策略,使用网络爬虫与微博第三方api技术相结合的方式获取微博数据;步骤二,利用分词处理技术从词库中调用关键词和敏感词,从微博文本数据中分析出关键词和敏感词;步骤三,依据分析出的关键词、敏感词以及情感倾向词对微博网页文本数据进行过滤,存储过滤记录;步骤四,热点话题模块通过聚类分析技术将##与[]符号之间括住的内容,标记为一个话题,以统计微博评论数和转发次数等为依据,分析出当前的热点话题,大大提高了话题分析的准确性;步骤五,热点人物模块通过聚类分析技术以分析微博粉丝数量、评论数量,确定指定条件的热点人物;步骤六,微博预警模块从网络微博中分析出与关键字和敏感词有关的微博信息,及时为用户作出预警通知;步骤七,分析统计模块对系统中分析出的相关数据自动生成简报,供用于分析使用。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海锐英软件技术有限公司,未经上海锐英软件技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310284081.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种微通道换热器组件
- 下一篇:一种五自由度平面关节机器人机构