[发明专利]一种基于声音的手势识别方法有效
申请号: | 201310206928.0 | 申请日: | 2013-05-30 |
公开(公告)号: | CN103885744B | 公开(公告)日: | 2017-04-19 |
发明(设计)人: | 刘鑫;刘西耀;邹长俊;刘东权 | 申请(专利权)人: | 美声克(成都)科技有限公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16;G06F3/0487 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于声音的手势识别方法,利用常见的麦克风与音响,作为接收信号与发射信号的硬件支持,音响产生人耳不易察觉的高频音,由麦克风接收来自肢体运动中返弹回来的音频信号,借助返回音频信号的物理现象多普勒效应,进行频谱分析,将获取的肢体动作的信息定义为相应的一些逻辑信号,并借助这些逻辑信号控制计算机的很多操作。本发明提供的技术以及相关的设计,在计算机控制方面提供了一种全新的人机交互方式,能够给计算机用户带来有趣的用户体验与交互感受。 | ||
搜索关键词: | 一种 基于 声音 手势 识别 方法 | ||
【主权项】:
一种基于声音的手势识别方法,包括以下步骤:a)处理由麦克风接收到返回的音频信号,利用带通滤波器过滤掉不关心的频带的信号,使用窗口函数减少频谱泄露的影响,采取快速傅里叶变换获得频域信号,并处理为分贝数据存储在采样队列Queue1当中;b)从采样队列Queue1中获取频谱分析窗口队列w1,计算公式为:其中:Queue1是由步骤a)获得的采样队列;f0是音频信号的中心频率;fshift是频率变化的最大值;fmin是频谱信号最小分辨率;x表示窗口队列w1中的离散信号序号;c)从频谱分析窗口队列中获取最大频率偏移fshift的左均值Wleft和右均值Wright:d)模拟定义逻辑的周期Tsimulate,如果Tsimulate过长,用户会有明显的延迟感,会使得人机交互感很差,但是Tsimulate过短,采样数据不能及时更新,会产生大量的误操作;将由于信号采样频率与采集信号处理分析频率之间的差异造成必然误差率定义为必然误差率Rerror,Tsimulate的表达式为:Tsimulate=T01+Rerror]]>其中:T0是采样周期;Rerror是必然误差率;e)定义一个受中心频率f0的能量Epeak和权值α影响的阈值TDegree,计算单位Tsimulate周期里,左均值Wleft和右均值Wright的变化率,并与阈值TDegree进行比较:其中:α是权值,其取值为0以上2以下的实数;Epeak是中心频率f0的能量;Rleft=ΔWleftT0]]>Rright=ΔWrightT0]]>其中,Rleft表示手势向左运动的频率变化率;Rright表示手势向右运动的频率变化率;比较过程:Rleft>TDegree则发生的是一个远离麦克风的动作,记录消息为Levent到消息队列Queueevent中;Rright>TDegree则发生的是一个靠近麦克风的动作,记录消息为Revent到消息队列Queueevent中;Rleft>TDegreeand Rright>TDegree则发生的是一个复合动作,记录消息为Devent到消息队列Queueevent中;所述复合动作指翻转手势,或者双手前后运动;f)设定等待时间Tdelay,在等待时间Tdelay内,如果产生消息,则记录消息到消息队列Queueevent中,定时器归位,重新等待Tdelay时间;如果没有产生消息,则对消息队列Queueevent进行一次消息处理分析,并清空队列;g)某个Tdelay时间内没有定时器归位操作,对消息队列Queueevent处理分析,获得消息逻辑,并对该消息逻辑映射的操作进行模拟,实现控制计算机,完成人机交互的目的。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美声克(成都)科技有限公司,未经美声克(成都)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310206928.0/,转载请声明来源钻瓜专利网。