[发明专利]一种基于两层时空邻域特征的动作识别方法有效
申请号: | 201610249150.5 | 申请日: | 2016-04-20 |
公开(公告)号: | CN105956604B | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 胡海峰;肖翔;张伟;顾建权 | 申请(专利权)人: | 广东顺德中山大学卡内基梅隆大学国际联合研究院;中山大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 44102 广州粤高专利商标代理有限公司 | 代理人: | 林丽明 |
地址: | 528300 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于两层时空邻域特征的动作识别方法,包括:对输入的视频,根据视频中连续帧的运动方向变化信息,提取运动变化模式特征作为视频的第一层原始特征。对第一层特征采用改进的词袋模型进行特征建模,得到第一层特征的向量表示。根据第一层中的每个局部兴趣点和最近邻若干兴趣点之间的时空关系,计算出第二层时空特征。对第二层特征采用改进的词袋模型进行特征建模,得到第二层特征的向量表示。将第一、二层的向量表示级联,形成视频最终的中层特征表达。采用支持向量机进行特征分类,得到识别准确率。本发明能有效地获取最近邻兴趣点的相对位置信息和类别信息,并结合了改进的词袋模型方法进行特征建模,显著提高了动作识别的准确率。 | ||
搜索关键词: | 一种 基于 时空 邻域 特征 动作 识别 方法 | ||
【主权项】:
1.一种基于两层时空邻域特征的动作识别方法,其特征在于,包括以下步骤:/n(1)输入待识别的视频,根据视频中连续帧的运动方向变化信息,提取运动变化模式特征作为视频的第一层原始特征;/n(2)对第一层原始特征采用包含k-means++聚类方法的改进的词袋模型进行特征建模,得到第一层原始特征的向量表示;/n(3)根据第一层原始特征中的每个局部兴趣点和最近邻若干兴趣点之间的时空关系,计算出第二层时空特征;/n(4)对第二层时空特征同样采用改进的词袋模型进行特征建模,得到第二层时空特征的向量表示;/n(5)将第一层原始特征和第二层时空特征的向量表示级联起来,形成该视频最终的中层特征表达;/n(6)采用支持向量机(SVM)进行特征分类,最终输出动作视频的识别准确率;/n所述改进的词袋模型的具体实现包括数据聚类和计算统计频率直方图这两个步骤,其聚类是采用k-means++方法,k-means++方法的描述如下:/n(3-1)从输入的数据点集合中随机选择一个点作为第一个聚类中心;/n(3-2)对于数据集中的每一个点x,计算它与已选择的聚类中心中最近的聚类中心的距离D(x);/n(3-3)选择一个新的数据点作为新的聚类中心,其选择的原则是:D(x)较大的点,被选取作为聚类中心的概率较大;/n(3-4)重复步骤(3-2)和(3-3)直到k个聚类中心被选出来;/n(3-5)利用这k个初始的聚类中心来运行标准的k-means算法。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东顺德中山大学卡内基梅隆大学国际联合研究院;中山大学,未经广东顺德中山大学卡内基梅隆大学国际联合研究院;中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610249150.5/,转载请声明来源钻瓜专利网。