[发明专利]基于听觉掩蔽效应的语音可懂度测量方法有效
申请号: | 201310430429.X | 申请日: | 2013-09-18 |
公开(公告)号: | CN103578479A | 公开(公告)日: | 2014-02-12 |
发明(设计)人: | 储飞黄;孙战先;李昂;路后兵;吴微露;瞿洋;南旭东;许士敏 | 申请(专利权)人: | 中国人民解放军电子工程学院;储飞黄 |
主分类号: | G10L25/60 | 分类号: | G10L25/60 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 何梅生 |
地址: | 230037 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于听觉掩蔽效应的语音可懂度测量方法,其特征是:通过对参考信号及其通过通信或语音传输系统后的输出信号进行分帧,并以帧为基本单元,根据ISO/IEC11172-3标准中的心理声学模型,分别估计参考与输出信号的听觉掩蔽门限;根据听觉掩蔽门限提取参考与输出信号中的可听分量;根据ISO226-2003标准等响度级曲线,分别将参考信号可听分量、输出信号可听分量的幅度转换为响度,计算每帧信号的感知相似度、语音信息保真度和感知信噪比,进而得到输出信号失真度;根据失真度与可懂度关系曲线,对输出信号进行可懂度预测。与目前常用语音可懂度客观测量方法相比,本发明方法测量精度更高。 | ||
搜索关键词: | 基于 听觉 掩蔽 效应 语音 可懂度 测量方法 | ||
【主权项】:
一种基于听觉掩蔽效应的语音可懂度测量方法,其特征是按如下步骤进行:步骤一:分别对参考信号及所述参考信号通过通信或语音传输系统后的输出信号进行分帧,帧长取值为25ms~64ms,每帧前后各重叠1/8~1/3帧长;步骤二:以帧为基本分析单元,根据ISO/IEC11172‑3标准中的心理声学模型,分别估计参考信号与输出信号的听觉掩蔽门限,将能量大于听觉掩蔽门限的功率谱分量定义为信号可听分量,检查输出信号可听分量的各频率成份,如果对应参考信号的相应频率成份是参考信号可听分量,则定义为输出有效语音信息分量,否则定义为输出无效语音信息分量;步骤三:根据ISO226‑2003标准等响度级曲线,分别将参考信号可听分量、包括输出有效语音信息分量和输出无效语音信息分量的输出信号可听分量的幅度转换为响度;步骤四:根据参考信号可听分量、输出信号可听分量和输出有效语音信息分量的响度,计算每帧输出信号的感知相似度、语音信息保真度和感知信噪比;根据输出每帧信号的感知相似度、语音信息保真度和感知信噪比计算输出信号失真度;步骤五:根据输出信号失真度与可懂度的关系曲线,进行可懂度预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军电子工程学院;储飞黄,未经中国人民解放军电子工程学院;储飞黄许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310430429.X/,转载请声明来源钻瓜专利网。