[发明专利]基于听觉掩蔽效应的语音可懂度测量方法有效

专利信息
申请号: 201310430429.X 申请日: 2013-09-18
公开(公告)号: CN103578479A 公开(公告)日: 2014-02-12
发明(设计)人: 储飞黄;孙战先;李昂;路后兵;吴微露;瞿洋;南旭东;许士敏 申请(专利权)人: 中国人民解放军电子工程学院;储飞黄
主分类号: G10L25/60 分类号: G10L25/60
代理公司: 安徽省合肥新安专利代理有限责任公司 34101 代理人: 何梅生
地址: 230037 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于听觉掩蔽效应的语音可懂度测量方法,其特征是:通过对参考信号及其通过通信或语音传输系统后的输出信号进行分帧,并以帧为基本单元,根据ISO/IEC11172-3标准中的心理声学模型,分别估计参考与输出信号的听觉掩蔽门限;根据听觉掩蔽门限提取参考与输出信号中的可听分量;根据ISO226-2003标准等响度级曲线,分别将参考信号可听分量、输出信号可听分量的幅度转换为响度,计算每帧信号的感知相似度、语音信息保真度和感知信噪比,进而得到输出信号失真度;根据失真度与可懂度关系曲线,对输出信号进行可懂度预测。与目前常用语音可懂度客观测量方法相比,本发明方法测量精度更高。
搜索关键词: 基于 听觉 掩蔽 效应 语音 可懂度 测量方法
【主权项】:
一种基于听觉掩蔽效应的语音可懂度测量方法,其特征是按如下步骤进行:步骤一:分别对参考信号及所述参考信号通过通信或语音传输系统后的输出信号进行分帧,帧长取值为25ms~64ms,每帧前后各重叠1/8~1/3帧长;步骤二:以帧为基本分析单元,根据ISO/IEC11172‑3标准中的心理声学模型,分别估计参考信号与输出信号的听觉掩蔽门限,将能量大于听觉掩蔽门限的功率谱分量定义为信号可听分量,检查输出信号可听分量的各频率成份,如果对应参考信号的相应频率成份是参考信号可听分量,则定义为输出有效语音信息分量,否则定义为输出无效语音信息分量;步骤三:根据ISO226‑2003标准等响度级曲线,分别将参考信号可听分量、包括输出有效语音信息分量和输出无效语音信息分量的输出信号可听分量的幅度转换为响度;步骤四:根据参考信号可听分量、输出信号可听分量和输出有效语音信息分量的响度,计算每帧输出信号的感知相似度、语音信息保真度和感知信噪比;根据输出每帧信号的感知相似度、语音信息保真度和感知信噪比计算输出信号失真度;步骤五:根据输出信号失真度与可懂度的关系曲线,进行可懂度预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军电子工程学院;储飞黄,未经中国人民解放军电子工程学院;储飞黄许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310430429.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top