[发明专利]基于区域卷积神经网络的第一视角手势识别与交互方法有效
申请号: | 201710273519.0 | 申请日: | 2017-04-25 |
公开(公告)号: | CN107168527B | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 郑晓旭;徐向民;殷瑞祥;蔡博仑 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06K9/00;G06N3/08 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 林梅繁 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于区域卷积神经网络的第一视角手势识别与交互方法,该方法包括如下步骤:S1、获取训练数据;S2、设计一个基于区域神经网络,在用于手部检测的同时,也用于手势分类与指尖检测,使得神经网络输入为三通道RGB图像,输出为手势区域的外接矩阵左上角坐标和右下角坐标,以及手势类别、手势骨架关键点;S3,判断手势类别,根据不同交互需求输出相应的交互结果。本发明提供了一种完整的第一视角手势识别与交互方法,通过单模型训练与部分网络共享,提高了第一视角下手势识别的识别速度与准确性。 | ||
搜索关键词: | 基于 区域 卷积 神经网络 第一 视角 手势 识别 交互 方法 | ||
【主权项】:
1.基于区域卷积神经网络的第一视角手势识别与交互方法,其特征在于,包括以下步骤:S1、获取包括多种不同第一视角下的手势的训练数据,人工标定训练数据的标签,所述训练数据的标签包括手势区域的外接矩阵左上角坐标和右下角坐标、人工标定的手势类别、人工标定的关键骨架的坐标点;S2、设计一个基于区域卷积的神经网络,使得神经网络输入为三通道RGB图像,输出为手势区域的外接矩阵左上角坐标和右下角坐标,以及手势类别、手势骨架关键点;S3、判断手势类别,根据不同需求输出相应的交互结果;S4、利用手势判别结果进行指令判别,作出相应指令;步骤S2所述基于区域卷积的神经网络包括两部分,第一部分为包括卷积层‑池化层‑卷积层‑池化层‑卷积层‑池化层‑全连接层的卷积神经网络CNN模型,用于训练手部检测,第一部分的输入为RGB图像,训练输出为手势区域外接矩阵左上角坐标和右下角坐标;第二部分为包括ROI池化层‑卷积层‑池化层‑卷积层‑池化层‑全连接层的卷积神经网络CNN模型,输入为第一部分的最后一个池化层图像,并通过第一部分输出手势区域外接矩阵左上角坐标和右下角坐标,在ROI池化层作一致化处理,训练输出为手势类别及关键骨架的坐标位置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710273519.0/,转载请声明来源钻瓜专利网。