[发明专利]一种基于度量学习的用户轨迹相似性度量方法有效
申请号: | 201710847477.7 | 申请日: | 2017-09-19 |
公开(公告)号: | CN107679558B | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 邵俊明;刘松灵;杨勤丽;于忠靖;朱庆 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/29 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于度量学习的用户轨迹相似性度量方法,结合度量学习方法通过计算用户轨迹距离得到用户轨迹之间的相似性。首先生成每个用户的地点‑时间联合概率分布矩阵。接下来通过KL散度计算基于用户分布矩阵的不同用户轨迹之间的初始相似性,并通过谱聚类的方法生成用户轨迹的初始类别(即将用户轨迹按照相似性矩阵划分为不同的类别,以便利于后续的相似性度量函数计算)。最后在初始相似性矩阵S和轨迹初始类别集合C基础上,结合度量学习技术,获取具备用户偏好模式且具有相同维度的用户轨迹的相似性表征向量和度量函数数,在此基础上,计算用户轨迹之间的距离,得到用户轨迹相似性。 | ||
搜索关键词: | 用户轨迹 度量 相似性度量 相似性矩阵 相似性度量函数 矩阵 学习 概率分布矩阵 度量函数 方法生成 类别集合 时间联合 用户分布 用户偏好 聚类 散度 维度 向量 | ||
【主权项】:
1.一种基于度量学习的用户轨迹相似性度量方法,其特征在于,包括以下步骤:(1)、用户移动数据收集与整理清洗收集用户移动数据,根据分析需求对用户移动数据进行整理清洗:采用关键地点信息提取技术对隐藏在用户移动数据中关键地点的时间位置信息进行提取,得到用户基于关键地点的轨迹表征;(2)、用户地点‑时间联合分布计算首先利用聚类算法对全体用户的关键地点时间位置信息进行聚类,获取热点区域,再结合城市已知关键地点的位置信息,得到全体用户高频访问的关键地点,提取排名靠前也就是更多被访问的P个关键地点作为用户轨迹趋向访问的地点;对整个用户活动时间,按照其在时间维度上的分布进行动态划分,得到T个时间段,基于用户轨迹趋向访问地点和时间段划分,对每个用户,得到其地点‑时间联合概率分布矩阵
m为用户数量,该矩阵直接反映每位用户轨迹在空间维度和时间维度上的分布情况;(3)、用户轨迹初始相似性矩阵获取基于每个用户的地点‑时间联合概率分布矩阵
计算用户的轨迹与轨迹之间的初始相似性矩阵S:
其中,初始相似性矩阵S是一个对称的相似性矩阵,si,j表示用户i和用户j的相似度,定义如下:
其中,σ是函数宽度参数,根据具体实施情况确定,KL散度di,j定义为:
其中,wi(p,t)为地点‑时间联合概率分布矩阵
中,在时间段t,用户轨迹趋向访问地点p用户i出现的概率,wj(p,t)为地点‑时间联合概率分布矩阵
中,在时间段t,用户轨迹趋向访问地点p用户j出现的概率;(4)、轨迹初始类别获取对初始相似性矩阵S每行求和,按行对应依次作为对角矩阵D对角线上的元素,然后计算拉普拉斯矩阵L=D‑S,通过奇异值分解,求出拉普拉斯矩阵L的前k个最小特征值
和对应特征向量
构造矩阵M:将每一个特征向量
依次作为一列形成一个m行、k列的矩阵M,其中,矩阵M的每一行对应原来初始相似性矩阵S中的每一行也就是一个用户轨迹的k维表征;最后在这k维表征之上,采用K‑Means的方式获得每条用户轨迹的类别标签信息,组成轨迹初始类别集合C;(5)、轨迹相似性度量学习将初始相似性矩阵S和轨迹初始类别集合C分别对应到度量学习里中的两个要素即:相似性矩阵和边际信息,利用度量学习方法对整个用户轨迹集合进行处理,从而得到经过学习优化后的度量函数A,同时能够获取各用户轨迹在同一特征空间下的相似性表征向量
最后结合用户轨迹的相似性表征向量
和度量函数数A,利用马氏距离算法计算得到用户轨迹之间的距离:
用户轨迹之间的距离dist(svi,svj)越小,相似性越大,反之,相似性越小。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710847477.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种智能一体化供水设备
- 下一篇:太阳能电池片掰片设备