[发明专利]一种基于网络数据的电视剧点播量预测方法有效
申请号: | 201410255632.2 | 申请日: | 2014-06-11 |
公开(公告)号: | CN104035994B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 胡琴敏;徐晓枫;陈国梁;杜泽宇;罗念;钟哲凡 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙)31215 | 代理人: | 徐筱梅,张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于网络数据的电视剧点播量预测方法,其特点是将抓取的微博数量和搜索次数以及与电视剧相关数据运用相关性分析和单变量线性回归计算得到初始特征集,然后对初始特征集采用逐步回归法得到X和Xb特征集,将X和Xb特征集采用多元线性回归法分别得到电视剧首播前、后的两个预测模型,然后按预测值的大小进行电视剧的排名预测。本发明与现有技术相比具有提前预测点播系统中电视剧未来一段时间内的集均点播量,预测结果有效的反映出电视剧的热门程度,方法简便,准确性好,能为视频运营商在电视剧播出版权购买决策上提供依据,对在线点播系统的吸引用户和增加广告点击量提供强有力的支持。 | ||
搜索关键词: | 一种 基于 网络 数据 电视剧 点播 预测 方法 | ||
【主权项】:
一种基于网络数据的电视剧点播量预测方法,其特征在于以网络爬虫抓取电视剧首播前后与电视剧名相关的微博数量和搜索次数以及与电视剧相关数据,将抓取的数据运用相关性分析和单变量线性回归计算后建立初始特征集,然后对初始特征集采用逐步回归法得到X特征集和Xb特征集,将X特征集和Xb特征集采用多元线性回归法得到预测集均点播量,然后按预测值的大小进行电视剧的排名预测,具体预测按下述步骤进行:(一)、数据的抓取a、通过网络爬虫抓取已经结束热播的若干部电视剧以及与电视剧对应的基本数据;b、获取微博排行榜中娱乐领域排名前100的用户,然后根据关注关系,扩展用户数,并补全电视剧演员和各大卫视的官方微博,并抓取这批用户的微博数据;(二)、统计样本a、分析娱乐领域用户的数据,统计与电视剧相关的因素为A微博数据样本;b、统计若干部电视剧首播前一个月内每周的电视剧名相关总微博数和首播后15天中每天的微博数为B微博数据样本;c、统计百度指数中电视剧首播前一个月内每周电视剧名被搜索的次数和首播后15天中每天搜索次数为搜索数据样本;(三)、初始特征集的建立a、使用SPSS分析工具对统计样本中a步骤的相关因素与电视剧集均点播量分别进行皮尔逊相关系数和斯皮尔曼相关系数的计算,在置信度为5%条件下,只要满足其中一个相关性即为显著相关因素;b、使用SPSS分析工具分别对电视剧首播前一个月内每周的微博数量和首播后15天中每天的微博数量与电视剧首播前一个月内每周被搜索的次数与首播后15天中每天被搜索的次数进行单变量线性回归计算,得到每个变量对电视剧集均点播量的R2值,将每个时间点微博与搜索数据中较大的R2值作为特征因素,其中因变量为电视剧集均点播量,自变量为每个时间点的单变量;c、将上述a步骤中的显著相关因素与b步骤中较大的R2值组成初始特征集;(四)、X和Xb特征集的建立运用SPSS分析工具对初始特征集进行逐步回归计算得到X特征集,从X特征集中抽取电视剧首播前就能获取的特征得到Xb特征集;(五)、电视剧的排名预测运用SPSS分析工具对X特征集和Xb特征集进行多元回归计算得到两个预测模型,并对预测模型加入了偏执项和是否建立特定微博帐号的询问项,如果建立特定微博帐号,则在SPSS分析工具计算的结果加上该特定微博帐号电视剧集均的差值;由 Xb特征集经加入偏执项的多元回归计算得到能在电视剧首播前预测集均点播量的预测模型Ⅰ;由X特征集经加入偏执项的多元回归计算得到能在电视剧首播后预测集均点播量的预测模型Ⅱ,然后根据预测值的大小进行电视剧的排名预测;所述预测模型Ⅱ为电视剧首播后进行逐步修正的预测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410255632.2/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置