[发明专利]语音检测方法、装置及电子设备有效
申请号: | 201310698482.8 | 申请日: | 2013-12-18 |
公开(公告)号: | CN103617801B | 公开(公告)日: | 2017-09-29 |
发明(设计)人: | 戴海生 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G10L25/78 | 分类号: | G10L25/78 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王宝筠 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种语音检测方法、装置及电子设备,该方法包括通过所述音频采集单元获取音频信息;从所述音频信息中获取用户的语音信息;通过所述视频采集单元获取视频信息;从所述视频信息中获取所述用户发出与所述语音信息对应的语音时的面部表情变化信息;对所述语音信息以及所述面部表情变化信息进行判断,当判断结果表明所述语音信息满足第一预设条件且所述面部表情变化信息满足第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间,所述时间为时间段或时刻;利用所述时间确定所述语音信息的尾点语音端点。采用本发明实施例提供的方法、装置及电子设备,可以提高获取尾点语音端点的准确率。 | ||
搜索关键词: | 语音 检测 方法 装置 电子设备 | ||
【主权项】:
一种语音检测方法,应用于具有音频采集单元和视频采集单元的电子设备,其特征在于,所述语音信息检测方法包括:通过所述音频采集单元获取音频信息;从所述音频信息中获取用户发出的语音对应的语音信息;通过所述视频采集单元获取视频信息;从所述视频信息中获取所述用户发出与所述语音信息对应的语音时的面部表情变化信息;对所述语音信息以及所述面部表情变化信息进行判断,当判断结果表明所述语音信息满足第一预设条件且所述面部表情变化信息满足第二预设条件时,获取所述面部表情变化信息满足所述第二预设条件的时间,所述时间为时间段或时刻;利用所述时间确定所述语音信息的尾点语音端点;其中,所述时间为时间段,所述利用所述时间确定所述语音信息的尾点语音端点包括:当所述语音信息满足第一预设条件时,根据所述语音信息,以预设帧为时间间隔分别计算所述时间内各个时间点成为第一尾点语音端点的置信度;当所述面部表情变化信息满足第二预设条件时,根据所述面部表情变化信息,分别计算所述各个时间点成为第二尾点语音端点的置信度;根据为所述语音信息分配的第一权重、所述各个时间点成为第一尾点语音端点的置信度、为所述面部表情变化信息分配的第二权重以及所述各个时间点成为第二尾点语音端点的置信度,分别计算出所述各个时间点对应的尾点语音端点的置信度;从各个所述尾点语音端点的置信度中选择满足第三预设条件的尾点语音端点的置信度对应的尾点语音端点作为所述第一尾点语音端点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310698482.8/,转载请声明来源钻瓜专利网。
- 上一篇:不锈钢集烟罩焊接打磨处的保护结构
- 下一篇:一种非色散的红外检测器