[发明专利]一种基于共振峰曲线的语音信号动态特征提取方法有效
申请号: | 201610340935.3 | 申请日: | 2016-05-19 |
公开(公告)号: | CN106024010B | 公开(公告)日: | 2019-08-20 |
发明(设计)人: | 韩志艳;王健;王东;周建壮;郭继宁;刘继行;曹丽 | 申请(专利权)人: | 渤海大学 |
主分类号: | G10L25/15 | 分类号: | G10L25/15;G10L25/24;G10L15/02;G10L15/04;G10L25/18;G10L25/21 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 梁焱 |
地址: | 121013 辽宁省锦州*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于共振峰曲线的语音信号动态特征提取方法,属于汉语音信号动态特征提取技术领域。步骤为:采集语音信号;对语音信号进行预处理;提取语音信号共振峰频率特征;按照从第一帧到最后一帧的帧序,将预处理后的每帧语音信号的第一共振峰频率特征值进行组合获得第一共振峰曲线,依此类推,获得第二共振峰曲线、第三共振峰曲线及第四共振峰曲线;对获得的每条共振峰曲线进行快速傅里叶变换获得线性频谱;根据线性频谱获得能量谱;根据能量谱获得对数能量;对对数能量进行离散余弦变换。与现有方法相比,本发明提取的是语音信号动态特征,它具有时间相关性,揭示了语音信号前后以及相邻之间存在的密切关联,提高了语音识别的性能。 | ||
搜索关键词: | 一种 基于 共振 曲线 语音 信号 动态 特征 提取 方法 | ||
【主权项】:
1.一种基于共振峰曲线的语音信号动态特征提取方法,其特征在于,包括以下步骤:步骤1、采集语音信号;步骤2、对语音信号进行预处理,包括预加重、分帧加窗和端点检测;步骤3、采用基于Hibert‑Huang变换的方法,对预处理后语音信号的共振峰频率特征进行估算,获得每帧语音信号的第一共振峰特征值、第二共振峰特征值、第三共振峰特征值和第四共振峰特征值;由快速傅里叶变换初步估计出的语音信号的各阶共振峰频率确定相应带通滤波器的参数,并用该参数对语音信号作滤波处理,对滤波后的信号进行经验模态分解得到一族固有模态函数,按能量最大原则确定出含有共振峰频率的IMF,计算出该IMF的瞬时频率和Hilbert谱即得到语音信号的共振峰频率参数;步骤4、构成共振峰曲线,具体为:按照从第一帧到最后一帧的帧序,将预处理后的每帧语音信号的第一共振峰特征值进行组合获得第一共振峰曲线;按照从第一帧到最后一帧的帧序,将预处理后的每帧语音信号的第二共振峰特征值进行组合获得第二共振峰曲线;按照从第一帧到最后一帧的帧序,将预处理后的每帧语音信号的第三共振峰特征值进行组合获得第三共振峰曲线;按照从第一帧到最后一帧的帧序,将预处理后的每帧语音信号的第四共振峰特征值进行组合获得第四共振峰曲线;步骤5、对获得的第一共振峰曲线、第二共振峰曲线、第三共振峰曲线和第四共振峰曲线进行快速傅里叶变换,获得每条共振峰曲线的线性频谱;步骤6、根据线性频谱获得每条共振峰曲线的能量谱;步骤7、根据能量谱获得每条共振峰曲线的对数能量;步骤8、对上述对数能量进行离散余弦变换获得倒频谱域,即获得语音信号动态特征参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渤海大学,未经渤海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610340935.3/,转载请声明来源钻瓜专利网。