[发明专利]基于视频的行为识别方法及装置有效
申请号: | 201611239337.3 | 申请日: | 2016-12-28 |
公开(公告)号: | CN106709461B | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 乔宇;杜文斌;王亚立 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/02 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 阳开亮 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明适用于计算机科学技术领域,提供了基于视频的行为识别方法及装置,包括:提取所有采样时刻视频帧的深度特征,所述深度特征包括所述采样时刻视频帧中行为的高层语义特征和细节特征;基于所述采样时刻视频帧的细节特征,获取用于表达当前时刻视频帧的行为的时空特征;将所述时空特征与所述高层语义特征一同输入LSTM模型,以对所述当前时刻视频帧进行行为识别。本发明使时空特征和高层语义特征互补协作,以增强RNN识别复杂行为的能力。 | ||
搜索关键词: | 视频帧 高层语义特征 采样时刻 时空特征 行为识别 深度特征 细节特征 视频 计算机科学技术 复杂行为 协作 | ||
【主权项】:
1.一种基于视频的行为识别方法,其特征在于,包括:提取所有采样时刻视频帧的深度特征,所述深度特征包括所述采样时刻视频帧中行为的高层语义特征和细节特征;基于所述采样时刻视频帧的细节特征,获取用于表达当前时刻视频帧的行为的时空特征;将所述时空特征与所述高层语义特征一同输入LSTM模型,以对所述当前时刻视频帧进行行为识别;所述基于所述采样时刻视频帧的细节特征,获取用于表达当前时刻视频帧的行为的时空特征,包括:以长短时记忆神经网络LSTM上一时刻的隐藏状态
为引导,基于所有采样视频帧的所述特征立方体,估计各个空间位置的特征向量对于当前第t时刻视频帧行为识别的重要性:
其中,
是CV*(n,k)对于当前第t时刻视频帧重要性的未归一化空间权重分数,CV*(n,k)是第n个时刻视频帧的所述特征立方体的第k个位置的特征向量,n=1,…,T,k=1,…,K2,
是空间注意机制的模型参数;针对第n个时刻视频帧的所述特征立方体,对
进行归一化处理:
其中,γα是控制空间注意机制分数分布的形状参数;通过将外形流和运动流的空间权重分数取最大值,以融合不同流的空间重要性:
并计算所述当前时刻视频帧在外形流与运动流的行为的空间特征:
在得到关于所述当前时刻视频帧的T个空间特征
后,以
为引导,分别估计各个空间特征
对于所述当前时刻视频帧重要性的时间权重分数:
并对其进行归一化得到:![]()
是时间注意机制的模型参数;通过将外形流和运动流的时间权重分数取最大值,以融合不同流的时间重要性:
并将
与
带入
为外形流和运动流分别计算时空特征![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611239337.3/,转载请声明来源钻瓜专利网。
- 上一篇:滩涂生态恢复方法及装置
- 下一篇:基于分层语义的SAR图像分类方法