[发明专利]利用脑成像空间特征和底层视觉特征进行视频聚类的方法有效
申请号: | 201210293171.9 | 申请日: | 2012-08-17 |
公开(公告)号: | CN102855352A | 公开(公告)日: | 2013-01-02 |
发明(设计)人: | 韩军伟;吉祥;郭雷;胡新韬 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 王鲜凯 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种利用脑功能成像空间特征和底层视觉特征进行视频聚类的方法,其特征在于:提取功能磁共振图像序列中的大脑信号向量,计算信号向量的皮尔森相关系数矩阵,利用单因素方差分析和相关特征选择方法从皮尔森相关系数矩阵中提取脑功能成像空间特征,利用部分视频的底层视觉特征和对应的脑功能成像空间特征建立高斯过程回归模型,将剩余视频的底层视觉特征映射到脑功能成像空间特征上,将所有视频的脑功能成像空间特征和底层视觉特征进行多模态谱聚类。利用本发明方法,可以实现脑功能成像空间特征和底层视觉特征的融合聚类,与基于底层视觉特征如颜色、形状等视频聚类方法及单独使用脑功能特征空间聚类相比,大大提高了聚类准确性。 | ||
搜索关键词: | 利用 成像 空间 特征 底层 视觉 进行 视频 方法 | ||
【主权项】:
1.一种利用脑成像空间特征和底层视觉特征进行视频聚类的方法,其特征在于步骤如下:步骤1提取脑功能成像空间特征,具体步骤如下:步骤a1:利用公式p i , j , k = Σ s i , j , r s i , k , r - Σ s i , j , r Σ s i , k , r n ( Σ s i , j , r 2 - ( Σ s i , j , r ) 2 n ) ( Σ s i , k , r 2 - ( Σ s i , k , r ) 2 n ) ]]> 提取N个功能磁振图像序列中的,第i个功能磁共振图像序列上大脑M个区域的信号向量Si,j和Si,k的皮0。。。。尔森相关系数pi,j,k,得到第i个功能磁共振图像序列的皮尔森相关系数矩阵:P i = p i , 1,1 , p i , 1,2 , . . . , p i , 1 , k , . . . , p i , 1 , M p i , 2,1 , p i , 2,2 , . . . , p i , 2 , k , . . . , p i , 2 , M . . . p i , j , 1 , p i , j , 2 , . . . , p i , j , k , . . . , p i , j , M . . . p i , M , 1 , p i , M , 2 , . . . p i , M , k , . . . , p i , M , M ]]> 其中:信号向量Si,j=[si,j,1,Si,j,2,...,si,j,r,...Si,j,n],信号向量Si,k=[si,k,1,si,k,2,...,si,k,r,...Si,k,n],i表示N个功能磁共振图像序列中的第i个功能磁共振图像序列的序号,i=1,2,...,N,j,k=1,2,...,M,j表示第i个功能磁共振图像序列中大脑的第j个区域的序号,k表示第i个功能磁共振图像序列中大脑的第k个区域的序号,r表示信号向量Si,j和Si,k中第r个元素的序号,N∈[1,1000],M∈[1,1000],N表示功能磁共振图像序列的总数,M表示功能磁共振图像序列中大脑区域的总数;Si,j,r表示信号向量Si,j的第r个元素;si,k,r表示信号向量Si,k的第r个元素;n表示信号向量Si,j和Si,k的长度;所述N个功能磁共振图像序列,是利用功能磁共振技术,在测试者观看N个视频时测得的功能磁共振图像;步骤b1:取皮尔森相关系数矩阵Pi上三角部分,拉伸成向量Qi=[qi,1,qi,2,...,qi,d],d=(M×M)/2-M/2,然后将N个Qi向量按行排列构成矩阵D:D = Q 1 Q 2 . . . Q i . . . Q N = q 1,1 , q 1,2 , . . . , q 1 , d q 2,1 , q 2,2 , . . . , q 2 , d . . . q i , 1 , q i , 2 , . . . , q i , d . . . q N , 1 , q N , 2 , . . . q N , d ]]> 其中,qi,1,qi,2,...,qi,d表示Qi的第1,2,…,d个元素;步骤c1:计算矩阵D每一列元素的均值,将矩阵D的每一列元素减去该列元素的均值,得到矩阵U:U = U 1 U 2 . . . U i . . . U N = u 1,1 , u 1,2 , . . . , u 1 , d u 2,1 , u 2,2 , . . . , u 2 , d . . . u i , 1 , u i , 2 , . . . , u i , d . . . u N , 1 , u N , 2 , . . . u N , d ]]> 在矩阵U的第v列Uv=[u1,v,u2,v,...,uN,v]T中找出属于第K类视频的元素,并计算属于第K类视频的元素均值
得到类内均值向量
其中,U1,U2,...,Ui,...,UN表示N个视频对应的功能磁共振图像序列中提取的N个向量,N个视频可分为C类;u1,v,u2,v,...,uN,v表示Uv=[u1,v,u2,v,...,uN,v]T中的第1,2,...,N个元素,这N个元素按照对应的C类视频分为C类;K=1,2,...,C,K表示C类视频中的第K类;C表示N个视频的总类别个数;再利用公式
计算累计分布函数参数F;利用公式g = 1 - 1 exp ( gam ( C - 1 ) + gam ( N - C ) - gam ( N - 1 ) ) ]]> 计算参数g;当g<T时,T∈(0,10000],保留矩阵U中的第v列;否则,从矩阵U中删除该列,得到经过单因素方差分析选择后的矩阵B:B = B 1 B 2 . . . B i . . . B N = b 1,1 , b 1,2 , . . . , b 1 , x b 2,1 , b 2,2 , . . . , b 2 , x . . . b i , 1 , b i , 2 , . . . , b i , x . . . b N , 1 , b N , 2 , . . . b N , x ]]> 其中,C表示视频的类别总数;||表示取绝对值;L=[l1,l2,...,lK,...,lC]T;lK表示Uv中属于第K类视频的元素个数;θ为向量
和L间的夹角;![]()
表示Uv的均值;上标T表示转置;exp表示指数函数;
g<T中的T表示阈值,T∈(0,10000];下标x表示从U中选取的列向量的个数;步骤d1:遍历矩阵B的每一列,利用相关特征选择方法将参数
的数值最高的y列构成脑功能成像空间特征矩阵C:C = C 1 C 2 . . . C i . . . C N = c 1,1 , c 1,2 , . . . , c 1 , y c 2,1 , c 2,2 , . . . , c 2 , y . . . c i , 1 , c i , 2 , . . . , c i , y . . . c N , 1 , c N , 2 , . . . c N , y ]]> 其中:下标y表示从B中选取的列向量的个数;
表示向量[r1,w,r2,w,…,rs,w,…,ry,w]的均值;rs,w表示矩阵C的第s个列向量Cs与类别标签向量W=[1,1,1,...2,2,2,...,K,K,K,...C,C,C]T的相关性参数;上标T表示取向量转置;r s , w = 2.0 × [ Σ w h ∈ C s p ( w h ) Σ c sh ∈ C s p ( c s , h | w h ) log 2 p ( c s , h | w h ) - Σ c s , h ∈ C s p ( c s , h ) log 2 p ( c s , h ) - Σ c s , h ∈ C s p ( c s , h ) log 2 p ( c s , h ) - Σ w h ∈ W p ( w h ) log 2 p ( w h ) ] ; ]]> p(wh)表示wh在W中的概率分布;wh表示向量W中的第h个元素;p(cs,h|wh)表示cs,h在Cs中的条件概率分布;p(cs,h)表示cs,h在Cs中的概率分布;cs,h表示向量Cs中的第h个元素;log2表示以2为底数的对数函数;
表示矩阵:r 1,1 , r 1,2 , . . . , r 1 , o , . . . , r 1 , y r 2,1 , r 2,2 , . . . , r 2 , o , . . . , r 2 , y . . . r s , 1 , r s , 2 , . . . , r s , o , . . . , r s , y . . . r y , 1 , r y , 2 , . . . , r y , o , . . . , r y , y ]]> 中所有元素的均值;rs,o表示矩阵C的第s个列向量Cs与第o个列向量Co的相关性参数;r s , o = 2.0 × [ Σ c o , h ∈ C o p ( c o , h ) Σ c s , h ∈ C s p ( c s , h | c o , h ) log 2 p ( c s , h | c o , h ) - Σ c s , h ∈ C s p ( c s , h ) log 2 p ( c s , h ) - Σ c s , h ∈ C s p ( c s , h ) log 2 p ( c s , h ) - Σ c o , h ∈ C o p ( c o , h ) log 2 p ( c o , h ) ] ; ]]> co,h表示向量Co中的第h个元素;p(co,h)表示co,h在Co中的概率分布;p(cs,h|co,h)表示cs,h在Cs中的条件概率分布;步骤2提取视频库中所有Na个视频数据的底层视觉特征向量Fvid,具体步骤如下:步骤a2:利用尺度不变特征变换算法提取第id个视频第一帧的Nsi个描述向量集合FSid={Fsiid,1,Fsiid,2,...,Fsiid,sh,...,Fsiid,Nsi},sh=1,2,...,Nsi,id=1,2,...,Na,Na∈(0,100000],Nsi∈[0,10000],对Na个视频都提取描述向量集合,得到[ FS 1 FS 2 , . . . , FS id , . . . , FS N a ] ; ]]> 步骤b2:利用k均值算法对
进行聚类,聚类个数为G;步骤c2:计算FSid={Fsiid,1,Fsiid,2,...,Fsiid,sh,...,Fsiid,Nsi}中分别属于G类的向量个数[Numid,1,Numid,2,...,Numid,G],得到第id个视频的底层视觉特征向量:Fvid=[Numid,1,Numid,2,...,Numid,G];步骤3利用高斯过程回归算法预测Na-N个视频数据的脑功能成像空间特征向量:利用脑功能成像空间特征矩阵C和其对应N个视频的底层视觉特征[Fv1,Fv2,...,Fvidp,...,FvN],idp=1,2,...,N,建立高斯过程回归模型GPM,利用高斯过程回归模型GPM预测得到Na-N个视频的脑功能成像空间特征向量:C N + 1 C N + 2 . . . C N a = c N + 1,1 , c N + 1,2 , . . . , c N + 1 , y c N + 2,1 , c N + 2,2 , . . . , c N + 2 , y . . . c N a , 1 , c N a , 2 , . . . , c N a , y ; ]]> 步骤4利用Na个脑功能成像空间特征向量[C1,C2,...,Cid,...,CNa]和底层视觉特征[Fv1,Fv2,...,Fvid,...,FvNa]进行多模态谱聚类,具体步骤如下:步骤a3:计算[C1,C2,...,Cid,...,CNa]中与空间中的一个点Cid=(cid,1,cid,2,...,cid,y)欧氏距离最近的k个点,并定义为近邻关系,k=[1,10000];再计算[Fv1,Fv2,...,Fvid,...,FvNa]中与空间中的一个点Fvid=(fvid,1,fvid,2,...,fvid,y)欧氏距离最近的k个点,并定义为近邻关系;其中:cid,1,cid,2,...ci,d表示脑功能成像空间特征Cid中第1、2和y个元素;fvid,1,fvid,2,...,fvid,y表示底层视觉特征Fvid中第1、2和y个元素;步骤b3:利用
计算属于近邻关系的Cid和Cjd 两点间的权重CWeightid,jd,得到权重矩阵;CWeight = CWeight 1,1 , CWeight 1,2 , . . . , CWeight 1 , jd , . . . , CWeight 1 , N a CWeight 2,1 , CWeight 2,2 , . . . , CWeight 2 , jd , . . . , CWeight 2 , N a . . . CWeight id , 1 , CWeight id , 2 , . . . , CWeight id , jd , . . . , CWeight id , N a . . . CWeight N a , 1 , CWeight N a , 2 , . . . , CWeight N a , jd , . . . , CWeight N a , N a ]]> 同理,利用
计算属于近邻关系Fvi和Fvj之间的权重FvWeightid,jd,得到权重矩阵:FvWeight = FvWeight 1,1 , FvWeight 1,2 , . . . , FvWeight 1 , jd , . . . , FvWeight 1 , N a FvWeight 2,1 , FvWeight 2,2 , . . . , FvWeight 2 , jd , . . . , FvWeight 2 , N a . . . FvWeight id , 1 , FvWeight id , 2 , . . . , FvWeight id , jd , . . . , FvWeight id , N a . . . FvWeight N a , 1 , FvWeight N a , 2 , . . . , FvWeight N a , jd , . . . , FvWeight N a , N a ]]> 其中:Cid和Cjd表示第id个视频和第jd个视频的脑功能成像空间特征向量;∏表示连乘积;cid,l和cjd,l表示Cid和Cjd的第l个元素;l=1,2,...,y;σl表示一个常数,σl∈(0,1];Fvid和Fvjd表示第id个视频和第jd个视频的底层视觉特征向量;Fvid,l和Fvjd,l表示Fvid和Fvjd的第l个元素;步骤c3:在矩阵CWeight中令CWeightid,id=0;在矩阵FvWeight中令FvWeightid,id=0;再利用公式LC = DC - CWeight LFv = DFv - FvWeight ]]> 计00000000算CWeight和FvWeight的拉普拉斯矩阵;利用公式Lmulti-modal=LC+αI+LFv+αI计算多模态拉普拉斯矩阵Lmulti-modal,大小为Na×Na;其中:LC和LFv表示矩阵CWeight和FvWeight的拉普拉斯矩阵;DC表示[C1,C2,...,Cid,...,CNa]中两两脑功能成像空间特征向量之间的欧式距离所构成的矩阵;DFv表示[Fv1,Fv2,...,Fvid,...,FvNa]中两两底视觉层特征向量之间的欧式距离所构成的矩阵;I表示单位矩阵,大小为Na×Na;α表示常数;步骤d3:计算多模态拉普拉斯矩阵Lmulti-modal的特征值和特征向量,将特征值从大到小排列,选取前C个特征值对应的特征向量Vector1,Vector2,...,VectorC,构成矩阵VecMatrix=[Vector1,Vector2,...,VectorC],大小为Na×C,计算矩阵VecMatrix每一行的和,然后用该行元素分别除以该行元素的和,得到矩阵VecMatrixNew,大小为Na×C;其中:C表示视频库中视频类别个数;步骤e3:将VecMatrixNew每行中值最大的元素置为1,其余元素置为0,得到VecMatrixNew1;步骤f3:将VecMatrixNew1的每一行视为高维空间中的一个点,用光谱旋转算法对VecMatrixNew1矩阵中的Na个点进行聚类,得到类别矩阵Index,大小为Na×C;步骤g3:利用公式Index0=Index+0.2得到初始类别矩阵Index0,计算Indexnew=Index0×diag[[diag(Index0T×I×Index0)]-1]-1/2,将Indexnew赋给Index0,再次计算Indexnew=Index0×diag[[diag(Index0T×I×Index0)]-1]-1/2,将Indexnew赋给Index0,重复Ne次,Ne∈[1,10000],得到最终的Indexnew,大小为Na×C,计算Indexnew每行最大值所在的第cg列,将最终标签Indexfinal对应行置为cg,cg∈[1,2,..,C],Indexfinal大小为Na×1;其中,diag表示提取矩阵的对角线元素;I表示单位向量;步骤h3:计算Indexfinal与视频真实类别标签IndexTrue的相同元素个数,除以Na得到视频聚类准确率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210293171.9/,转载请声明来源钻瓜专利网。