[发明专利]语音识别系统中基于快速噪声估计的特征补偿方法有效
申请号: | 201210486936.0 | 申请日: | 2012-11-26 |
公开(公告)号: | CN103000174A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | 吕勇 | 申请(专利权)人: | 河海大学 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/14 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210098 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种语音识别系统中基于快速噪声估计的特征补偿方法,其主要特点是将特征补偿中的噪声参数估计和纯净语音估计分离开来,噪声估计和纯净语音估计用不同的高斯混合模型实现。一个含有较少高斯单元的高斯混合模型GMM用于从含噪测试语音中提取噪声参数;另一个含有较多高斯单元的高斯混合模型GMM用于与估得的单高斯噪声模型进行模型组合,得到与当前测试环境匹配的含噪GMM;最后用含噪GMM计算含噪测试语音的后验概率,用最小均方误差方法从含噪测试语音中估计纯净语音特征向量。本发明可以在减小计算量的同时,保证纯净语音估计的精度。 | ||
搜索关键词: | 语音 识别 系统 基于 快速 噪声 估计 特征 补偿 方法 | ||
【主权项】:
一种语音识别系统中基于快速噪声估计的特征补偿方法,其特征在于,包括如下步骤:(1)采用美尔频率倒谱系数作为语音识别系统的特征参数,特征补偿的目的是从含噪测试语音中提取纯净语音MFCC;(2)在训练阶段,用高斯混合模型对语音的分布进行建模,用全部训练语音生成两个GMM:第一GMM和第二GMM;(3)用单高斯模型对背景噪声进行建模,为了实时跟踪环境的变化,单高斯噪声模型的均值向量和协方差矩阵从含噪测试语音中提取;(4)用第一GMM从含噪测试语音MFCC中提取噪声参数,包括噪声的高斯均值向量和协方差矩阵;(5)用估得的噪声参数对第二GMM2的均值和方差进行参数变换,即对单高斯噪声模型和第二GMM进行模型组合,得到第二GMM的含噪语音均值和方差;(6)用第二GMM的含噪语音均值和方差计算含噪测试语音的后验概率,用最小均方误差方法估计纯净语音MFCC;(7)纯净语音特征向量的一阶动态系数和二阶动态系数不直接从含噪测试语音中估计,而是通过对估得的静态系数作时域差分得到。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210486936.0/,转载请声明来源钻瓜专利网。
- 上一篇:包含胆固醇和作为唯一的佐剂-载剂分子的CPG的疫苗
- 下一篇:磁性纳米微粒