[发明专利]一种旅客画像及数据分析的方法及装置在审
申请号: | 201610458105.0 | 申请日: | 2016-06-22 |
公开(公告)号: | CN106127515A | 公开(公告)日: | 2016-11-16 |
发明(设计)人: | 莫倩;王拓宇;王恺;史磊 | 申请(专利权)人: | 北京网智天元科技股份有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/14 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100048 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种用户画像方法及设备,具体说是一种旅客画像及数据分析的方法及装置。通过整合、分析交通运输和旅游行业中产生的数据为旅客用户进行画像,挖掘用户爱好,解决旅客基本特征描述,细分客户群,预测行业发展趋势以及旅客的未来行为特征,并为旅客的个性化服务提供支撑。 | ||
搜索关键词: | 一种 旅客 画像 数据 分析 方法 装置 | ||
【主权项】:
一种旅客画像及数据分析的方法,其特征在于包括如下步骤:A)建立数据库;从数据源中获取旅客身份信息和行为数据,存入数据库;B)建立标签模型;根据数据库中的旅客身份信息的特征和行为数据的特征建立相应的标签并赋予每一标签相应的值域和权重;所述标签权重的取值表示该标签对用户行为影响的重要程度;标签的权重表示为时间衰减因子与数据来源权重的乘积;所述时间衰减因子与标签的形成时间相关,所述数据来源权重与标签数据的来源相关;C)计算标签权重;利用如下算法计算标签的权重Tij,得到一组归并的标签,形成当前时间窗的用户画像;Tij=Rij*Wij其中,Rij表示第i个标签中第j个值的时间因子,i代表标签编号,j代表该标签中第j个值,其计算公式如下:![]()
其中,Kij为数据集合中与第i个标签第j个值对应的数据条数;Rijm是第m条记录的时间因子。其计算公式如下:
其中tnowm‑tstartm<=tmaxtnowm第m条数据当前时间,tstartm为第m条数据生成时间,(tnowm‑tstartm)为数据生成距离当前时间间隔,α为时间因子衰减率,tmax为时间窗口大小,即超过该时间窗口的数据记录不用来计算标签权重;数据来源权重Wij表示为:i代表标签编号,j代表该标签中第j个值。Wij表示第i个标签中第j个值的数据权重;计算公式如下:![]()
Kij为数据集合中与第i个标签第j个值对应的数据条数;D)预测分析;利用上述步骤获得的数据建立时间序列分析模型,使用时间序列分析模型预测用户未来的行为。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京网智天元科技股份有限公司,未经北京网智天元科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610458105.0/,转载请声明来源钻瓜专利网。
- 上一篇:吊椅
- 下一篇:右转角沙发(BHR‑3263)
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置