[发明专利]利用脑成像空间特征和底层视觉特征进行视频聚类的方法有效

申请号：	201210293171.9	申请日：	2012-08-17
公开（公告）号：	CN102855352A	公开（公告）日：	2013-01-02
发明（设计）人：	韩军伟;吉祥;郭雷;胡新韬	申请（专利权）人：	西北工业大学
主分类号：	G06F17/50	分类号：	G06F17/50
代理公司：	西北工业大学专利中心 61204	代理人：	王鲜凯
地址：	710072 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种利用脑功能成像空间特征和底层视觉特征进行视频聚类的方法，其特征在于：提取功能磁共振图像序列中的大脑信号向量，计算信号向量的皮尔森相关系数矩阵，利用单因素方差分析和相关特征选择方法从皮尔森相关系数矩阵中提取脑功能成像空间特征，利用部分视频的底层视觉特征和对应的脑功能成像空间特征建立高斯过程回归模型，将剩余视频的底层视觉特征映射到脑功能成像空间特征上，将所有视频的脑功能成像空间特征和底层视觉特征进行多模态谱聚类。利用本发明方法，可以实现脑功能成像空间特征和底层视觉特征的融合聚类，与基于底层视觉特征如颜色、形状等视频聚类方法及单独使用脑功能特征空间聚类相比，大大提高了聚类准确性。
搜索关键词：	利用成像空间特征底层视觉进行视频方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种利用脑成像空间特征和底层视觉特征进行视频聚类的方法，其特征在于步骤如下：步骤1提取脑功能成像空间特征，具体步骤如下：步骤a1：利用公式pi,j,k=Σsi,j,rsi,k,r-Σsi,j,rΣsi,k,rn(Σsi,j,r2-(Σsi,j,r)2n)(Σsi,k,r2-(Σsi,k,r)2n)]]>提取N个功能磁振图像序列中的，第i个功能磁共振图像序列上大脑M个区域的信号向量S_i，j和S_i，k的皮0。。。。尔森相关系数p_i，j，k，得到第i个功能磁共振图像序列的皮尔森相关系数矩阵：Pi=pi,1,1,pi,1,2,...,pi,1,k,...,pi,1,Mpi,2,1,pi,2,2,...,pi,2,k,...,pi,2,M...pi,j,1,pi,j,2,...,pi,j,k,...,pi,j,M...pi,M,1,pi,M,2,...pi,M,k,...,pi,M,M]]>其中：信号向量S_i，j＝[s_i，j，1,S_i，j，2,...,s_i，j，r，...S_i，j，n]，信号向量S_i，k＝[s_i，k，1,s_i，k，2,...,s_i，k，r,...S_i，k，n]，i表示N个功能磁共振图像序列中的第i个功能磁共振图像序列的序号，i＝1,2,...,N，j,k=1,2，...，M，j表示第i个功能磁共振图像序列中大脑的第j个区域的序号，k表示第i个功能磁共振图像序列中大脑的第k个区域的序号，r表示信号向量S_i，j和S_i，k中第r个元素的序号，N∈[1,1000]，M∈[1,1000]，N表示功能磁共振图像序列的总数，M表示功能磁共振图像序列中大脑区域的总数；S_i，j，r表示信号向量S_i，j的第r个元素；s_i，k，r表示信号向量S_i，k的第r个元素；n表示信号向量S_i，j和S_i，k的长度；所述N个功能磁共振图像序列，是利用功能磁共振技术，在测试者观看N个视频时测得的功能磁共振图像；步骤b1：取皮尔森相关系数矩阵P_i上三角部分，拉伸成向量Q_i＝[q_i，1,q_i，2,...,q_i，d]，d＝(M×M)/2-M/2，然后将N个Q_i向量按行排列构成矩阵D：D=Q1Q2...Qi...QN=q1,1,q1,2,...,q1,dq2,1,q2,2,...,q2,d...qi,1,qi,2,...,qi,d...qN,1,qN,2,...qN,d]]>其中，q_i，1,q_i，2,...,q_i,d表示Q_i的第1，2，…，d个元素；步骤c1：计算矩阵D每一列元素的均值，将矩阵D的每一列元素减去该列元素的均值，得到矩阵U：U=U1U2...Ui...UN=u1,1,u1,2,...,u1,du2,1,u2,2,...,u2,d...ui,1,ui,2,...,ui,d...uN,1,uN,2,...uN,d]]>在矩阵U的第v列U_v=[u_1，v，u_2，v，...,u_N,v]^T中找出属于第K类视频的元素，并计算属于第K类视频的元素均值得到类内均值向量其中，U₁,U₂,...,U_i，...,U_N表示N个视频对应的功能磁共振图像序列中提取的N个向量，N个视频可分为C类；u_1，v,u_2，v，...,u_N,v表示U_v=[u_1，v，u_2，v，...,u_N,v]^T中的第1,2,...,N个元素，这N个元素按照对应的C类视频分为C类；K=1,2,...,C，K表示C类视频中的第K类；C表示N个视频的总类别个数；再利用公式计算累计分布函数参数F；利用公式g=1-1exp(gam(C-1)+gam(N-C)-gam(N-1))]]>计算参数g；当g＜T时，T∈(0,10000]，保留矩阵U中的第v列；否则，从矩阵U中删除该列，得到经过单因素方差分析选择后的矩阵B：B=B1B2...Bi...BN=b1,1,b1,2,...,b1,xb2,1,b2,2,...,b2,x...bi,1,bi,2,...,bi,x...bN,1,bN,2,...bN,x]]>其中，C表示视频的类别总数；||表示取绝对值；L＝[l₁,l₂,...,l_K,...,l_C]^T；l_K表示U_v中属于第K类视频的元素个数；θ为向量和L间的夹角；表示U_v的均值；上标T表示转置；exp表示指数函数；g＜T中的T表示阈值，T∈(0,10000]；下标x表示从U中选取的列向量的个数；步骤d1：遍历矩阵B的每一列，利用相关特征选择方法将参数的数值最高的y列构成脑功能成像空间特征矩阵C：C=C1C2...Ci...CN=c1,1,c1,2,...,c1,yc2,1,c2,2,...,c2,y...ci,1,ci,2,...,ci,y...cN,1,cN,2,...cN,y]]>其中：下标y表示从B中选取的列向量的个数；表示向量[r_1，w,r_2，w，…,r_s，w，…,r_y，w]的均值；r_s,w表示矩阵C的第s个列向量C_s与类别标签向量W=[1,1,1,...2,2,2,...,K，K，K,...C,C,C]^T的相关性参数；上标T表示取向量转置；rs,w=2.0×[Σwh∈Csp(wh)Σcsh∈Csp(cs,h|wh)log2p(cs,h|wh)-Σcs,h∈Csp(cs,h)log2p(cs,h)-Σcs,h∈Csp(cs,h)log2p(cs,h)-Σwh∈Wp(wh)log2p(wh)];]]>p(w_h)表示w_h在W中的概率分布；w_h表示向量W中的第h个元素；p(c_s,h|w_h)表示c_s,h在C_s中的条件概率分布；p(c_s，h)表示c_s，h在C_s中的概率分布；c_s，h表示向量C_s中的第h个元素；log₂表示以2为底数的对数函数；表示矩阵：r1,1,r1,2,...,r1,o,...,r1,yr2,1,r2,2,...,r2,o,...,r2,y...rs,1,rs,2,...,rs,o,...,rs,y...ry,1,ry,2,...,ry,o,...,ry,y]]>中所有元素的均值；r_s,o表示矩阵C的第s个列向量C_s与第o个列向量C_o的相关性参数；rs,o=2.0×[Σco,h∈Cop(co,h)Σcs,h∈Csp(cs,h|co,h)log2p(cs,h|co,h)-Σcs,h∈Csp(cs,h)log2p(cs,h)-Σcs,h∈Csp(cs,h)log2p(cs,h)-Σco,h∈Cop(co,h)log2p(co,h)];]]>c_o，h表示向量C_o中的第h个元素；p(c_o,h)表示c_o,h在C_o中的概率分布；p(c_s,h|c_o，h)表示c_s，h在C_s中的条件概率分布；步骤2提取视频库中所有N_a个视频数据的底层视觉特征向量Fv_id，具体步骤如下：步骤a2：利用尺度不变特征变换算法提取第id个视频第一帧的Nsi个描述向量集合FS_id＝{Fsi_id，1,Fsi_id，2,...,Fsi_id，sh，...,Fsi_id，Nsi}，sh＝1,2,...,Nsi，id＝1,2,...,N_a，N_a∈(0,100000]，Nsi∈[0,10000]，对N_a个视频都提取描述向量集合，得到[FS1FS2,...,FSid,...,FSNa];]]>步骤b2：利用k均值算法对进行聚类，聚类个数为G；步骤c2：计算FS_id＝{Fsi_id，1,Fsi_id，2,...,Fsi_id，sh，...,Fsi_id，Nsi}中分别属于G类的向量个数[Num_id，1，Num_id，2，...,Num_id,G]，得到第id个视频的底层视觉特征向量：Fv_id＝[Num_id，1，Num_id，2，...,Num_id,G]；步骤3利用高斯过程回归算法预测N_a-N个视频数据的脑功能成像空间特征向量：利用脑功能成像空间特征矩阵C和其对应N个视频的底层视觉特征[Fv₁,Fv₂,...,Fv_idp,...,Fv_N]，idp＝1,2,...,N，建立高斯过程回归模型GPM，利用高斯过程回归模型GPM预测得到N_a-N个视频的脑功能成像空间特征向量：CN+1CN+2...CNa=cN+1,1,cN+1,2,...,cN+1,ycN+2,1,cN+2,2,...,cN+2,y...cNa,1,cNa,2,...,cNa,y;]]>步骤4利用N_a个脑功能成像空间特征向量[C₁,C₂,...,C_id,...,C_Na]和底层视觉特征[Fv₁,Fv₂,...,Fv_id,...,Fv_Na]进行多模态谱聚类，具体步骤如下：步骤a3：计算[C₁,C₂,...,C_id，...,C_Na]中与空间中的一个点C_id=(c_id，1,c_id，2，...,c_id，y)欧氏距离最近的k个点，并定义为近邻关系，k=[1,10000]；再计算[Fv₁,Fv₂,...,Fv_id，...,Fv_Na]中与空间中的一个点Fv_id=(fv_id，1，fv_id，2，...,fv_id，y)欧氏距离最近的k个点，并定义为近邻关系；其中：c_id，1，c_id，2，...c_i，d表示脑功能成像空间特征C_id中第1、2和y个元素；fv_id，1,fv_id，2，...,fv_id，y表示底层视觉特征Fv_id中第1、2和y个元素；步骤b3：利用计算属于近邻关系的C_id和C_jd 两点间的权重CWeight_id，jd，得到权重矩阵；CWeight=CWeight1,1,CWeight1,2,...,CWeight1,jd,...,CWeight1,NaCWeight2,1,CWeight2,2,...,CWeight2,jd,...,CWeight2,Na...CWeightid,1,CWeightid,2,...,CWeightid,jd,...,CWeightid,Na...CWeightNa,1,CWeightNa,2,...,CWeightNa,jd,...,CWeightNa,Na]]>同理，利用计算属于近邻关系Fv_i和Fv_j之间的权重FvWeight_id，jd，得到权重矩阵：FvWeight=FvWeight1,1,FvWeight1,2,...,FvWeight1,jd,...,FvWeight1,NaFvWeight2,1,FvWeight2,2,...,FvWeight2,jd,...,FvWeight2,Na...FvWeightid,1,FvWeightid,2,...,FvWeightid,jd,...,FvWeightid,Na...FvWeightNa,1,FvWeightNa,2,...,FvWeightNa,jd,...,FvWeightNa,Na]]>其中：C_id和C_jd表示第id个视频和第jd个视频的脑功能成像空间特征向量；∏表示连乘积；c_id，l和c_jd，l表示C_id和C_jd的第l个元素；l＝1,2,...,y；σ_l表示一个常数，σ_l∈(0,1]；Fv_id和Fv_jd表示第id个视频和第jd个视频的底层视觉特征向量；Fv_id，l和Fv_jd,l表示Fv_id和Fv_jd的第l个元素；步骤c3：在矩阵CWeight中令CWeight_id，id＝0；在矩阵FvWeight中令FvWeight_id，id＝0；再利用公式LC=DC-CWeightLFv=DFv-FvWeight]]>计00000000算CWeight和FvWeight的拉普拉斯矩阵；利用公式L_multi-modal＝LC+αI+LFv+αI计算多模态拉普拉斯矩阵L_multi-modal，大小为N_a×N_a；其中：LC和LFv表示矩阵CWeight和FvWeight的拉普拉斯矩阵；DC表示[C₁,C₂,...,C_id，...,C_Na]中两两脑功能成像空间特征向量之间的欧式距离所构成的矩阵；DFv表示[Fv₁,Fv₂,...,Fv_id，...，Fv_Na]中两两底视觉层特征向量之间的欧式距离所构成的矩阵；I表示单位矩阵，大小为N_a×N_a；α表示常数；步骤d3：计算多模态拉普拉斯矩阵L_multi-modal的特征值和特征向量，将特征值从大到小排列，选取前C个特征值对应的特征向量Vector₁，Vector₂,...,Vector_C，构成矩阵VecMatrix=[Vector₁,Vector₂,...,Vector_C]，大小为N_a×C，计算矩阵VecMatrix每一行的和，然后用该行元素分别除以该行元素的和，得到矩阵VecMatrixNew，大小为N_a×C；其中：C表示视频库中视频类别个数；步骤e3：将VecMatrixNew每行中值最大的元素置为1，其余元素置为0，得到VecMatrixNew1；步骤f3：将VecMatrixNew1的每一行视为高维空间中的一个点，用光谱旋转算法对VecMatrixNew1矩阵中的N_a个点进行聚类，得到类别矩阵Index，大小为N_a×C；步骤g3：利用公式Index0=Index+0.2得到初始类别矩阵Index0，计算Indexnew=Index0×diag[[diag(Index0^T×I×Index0)]^-1]^-1/2，将Indexnew赋给Index0，再次计算Indexnew=Index0×diag[[diag(Index0^T×I×Index0)]^-1]^-1/2，将Indexnew赋给Index0，重复N_e次，N_e∈[1,10000]，得到最终的Indexnew，大小为N_a×C，计算Indexnew每行最大值所在的第cg列，将最终标签Indexfinal对应行置为cg，cg∈[1,2,..,C]，Indexfinal大小为N_a×1；其中，diag表示提取矩阵的对角线元素；I表示单位向量；步骤h3：计算Indexfinal与视频真实类别标签IndexTrue的相同元素个数，除以N_a得到视频聚类准确率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西北工业大学，未经西北工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201210293171.9/，转载请声明来源钻瓜专利网。

上一篇：基于测地距的径向基函数人脸表情重定向与动画方法
下一篇：聚氯乙烯排水管材及其制备方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]利用脑成像空间特征和底层视觉特征进行视频聚类的方法有效

专利文献下载