[发明专利]一种面向语音情感识别的语谱特征提取方法在审
申请号: | 201510020519.0 | 申请日: | 2015-01-16 |
公开(公告)号: | CN104637497A | 公开(公告)日: | 2015-05-20 |
发明(设计)人: | 梁瑞宇;冯月芹;唐闺臣;王青云;花涛;包永强;陈姝;顾保府 | 申请(专利权)人: | 南京工程学院 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/03 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 211167 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向语音情感识别的语谱特征提取方法,步骤一,对语音信号分帧,并进行快速傅里叶变换得到对应的语谱图;步骤二,对语谱图进行分解;步骤三,对分解图像进行中央周边差运算并归一化,得到每幅分解图的特征图;步骤四,提取每幅特征图的特征矩阵;步骤五,特征矩阵降维并重构。本发明从分析语音语谱特征的角度,综合运用图像处理的一些方法,从创新的角度挖掘情感识别的特征,采用多尺度多通道的滤波器对语谱图进行分解,在不同的特征域进行处理,并结合PCA分析,更好的挖掘对语音情感有益的信息。 | ||
搜索关键词: | 一种 面向 语音 情感 识别 特征 提取 方法 | ||
【主权项】:
一种面向语音情感识别的语谱特征提取方法,其特征在于:包括以下步骤,步骤一,对语音信号分帧,并进行快速傅里叶变换得到对应的语谱图;步骤二,对语谱图进行分解将图像与线性分解高斯核进行卷积运算,在不同的尺度上进行不同通道的分解,得到多通道多尺度的分解图像;所述通道包括颜色通道、亮度通道和方向通道;步骤三,对分解图像进行中央周边差运算并归一化,得到每幅分解图的特征图;步骤四,提取每幅特征图的特征矩阵将特征图分成m行n列,共m×n个子区域,用每个子区域的均值替代该子区域,将特征图归一化为m×n的特征矩阵;步骤五,特征矩阵降维并重构将每幅特征图对应的特征矩阵重塑为1×mn的特征向量,并由这些特征向量构成特征向量矩阵,通过对特征向量做主成分分析并保留其99%的主元,得到主特征向量矩阵。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510020519.0/,转载请声明来源钻瓜专利网。
- 上一篇:光盘设备、其控制方法、程序和信息存储介质
- 下一篇:响弦鼓