[发明专利]数据缺失下时间序列相似性度量方法有效

专利信息
申请号: 201410095671.0 申请日: 2014-03-14
公开(公告)号: CN103886195A 公开(公告)日: 2014-06-25
发明(设计)人: 祁宏生;王殿海;许骏;叶盈;韦薇;郑正非;蔡正义 申请(专利权)人: 浙江大学
主分类号: G06F19/00 分类号: G06F19/00
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 杜军
地址: 310027 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种能够适应缺失数据的时间序列相似性度量方法。该方法从原始的两个时间序列两两提取数据对,并根据数据缺失情况分为5种,分别计算一阶相似度区间;对一阶相似度区间,两两提取区间计算二阶相似度,并得到二阶相似度向量;最后对二阶相似度向量做平均,得到最终的两个时间序列的相似度。本发明能适应多种场景,方法简单,对数据完整性没有任何要求。
搜索关键词: 数据 缺失 时间 序列 相似性 度量 方法
【主权项】:
1.数据缺失下时间序列相似性度量方法,其特征在于:假设针对两个时间序列Xi=(xi1,xi2...)和Xj=(xj1,xj2...),时间序列长度都是N,时间序列每个值都有上限x,下限为0,相似度计算方法如下:1)两两提取两个时间序列的数据对,设分别对两个时间序列提取第m和第n个数据,得到xjm,xjn和xim,xin,共有对;且每一个数据的约束为2)针对这对数据中的每一对{xim,xin}和{xjm,xjn},分为如下五种情况考虑计算相似度区间,该区间称之为一阶相似度:(1)如果数据都不缺失,则按照下面的公式:smn({xim,xin},{xjm,xjn})=ximxjm+xinxjn(xjm)2+(xjn)2(xim)2+(xin)2]]>最终的数据对相似度区间为:smn∈[smn′({xim,xin},{xjm,xjn}),smn′({xim,xin},{xjm,xjn})](2)如果数据都缺失,也即{xim,xin}={NaN,NaN}以及{xjm,xjn}={NaN,NaN},则:smn∈[1,1](3)如果数据只有一个缺失,不失一般性,假设xjn=NaN,则按照余弦相似度计算思想,两个二元向量的相似度等于二维平面上两个向量的夹角余弦,当xjn空缺,由于xjn有上下限,从而,两个向量的夹角有一个最大值和最小值,从而相似度是一个也区间:smn∈[min(1,cos(Θ1),cos(Θ2)),max(1,cos(Θ1),cos(Θ2))]求得cos(Θ1)=xim(xim)2+(xin)2,cos(Θ2)=ximxjm+xinx(xjm)2+(x)2(xim)2+(xin)2;]]>(4)如果两个数据对都有数据缺失,且形式为{xim,xin}={xim,NaN}以及{xjm,xjn}={xjm,NaN},则相似度是一个区间:smn[0,max(xim(xim)2+(x)2,xjm(xjm)2+(x)2)]]]>(5)如果两个数据对都有一个缺失,且形式为{xim,xin}={xim,NaN}以及{xjm,xjn}={NaN,xjn};或者两个数据对共有三个缺失,形式为{xim,xin}={xim,NaN}以及{xjm,xjn}={NaN,NaN},有一个相似度区间:smn∈[0,1]3)将每一个smn区间统一表达为表示区间起始值,表示区间结束值,对个相似度区间,再依次两两计算相似度,称之为二阶相似度;假设某一对相似度区间分别为则它们的相似度smnkj为:smnkj=smn1skj1+smn2skj2(smn1)2+(skj1)2(skj1)2+(skj2)2,mn,kj]]>可知,smnkj的个数为CN(N-1)22=N(N-1)2(N(N-1)2-1)2=N4-2N3-N2-2N+28]]>4)对二阶相似度向量求平均,最终两个时间序列相似度s(Xi,Xj)为:s(Xi,Xj)=ΣmnmkjsmnkjN4-2N3-N2-2N+28=8Σmn,kjsmnkjN4-2N3-N3-2N+2]]>至此,两个缺失数据的时间序列相似度求出来了。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410095671.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top