[发明专利]一种基于模糊支持向量机的语音情感识别方法在审
申请号: | 201410331505.6 | 申请日: | 2014-07-11 |
公开(公告)号: | CN104091602A | 公开(公告)日: | 2014-10-08 |
发明(设计)人: | 周代英;谭发曾;贾继超;田兵兵;寥阔 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L17/02;G10L15/06;G10L17/04 |
代理公司: | 成都宏顺专利代理事务所(普通合伙) 51227 | 代理人: | 李玉兴 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及语音情感识别技术,具体的说是涉及一种基于模糊支持向量机的语音情感识别方法。本发明的方法包括:对输入的带有情感的语音信号进行预处理;所述预处理包括预加重滤波和加窗分帧;提取处理后的语音信号的特征信息梅尔倒普系数(MFCC);对所提取的梅尔倒普系数用核主成份分析(KPCA)进行降维处理;根据降维后的梅尔倒普系数特征信息进行分类识别,并输出识别结果;具体的分类识别方法为采用FSVM算法进行;本发明的有益效果为,通过MFCC情感特征,然后用KPCA对特征降维减少了冗余的信息,比直接使用MFCC特征的识别效果要好很多,其识别率更高,效果更好,且识别速度更快。本发明尤其适用于语音智能情感识别。 | ||
搜索关键词: | 一种 基于 模糊 支持 向量 语音 情感 识别 方法 | ||
【主权项】:
一种基于模糊支持向量机的语音情感识别方法,其特征在于,包括以下步骤:a.对输入的语音信号预处理;所述预处理包括预加重滤波和加窗分帧;b.提取处理后的语音信号的特征信息;所述特征信息为梅尔倒普系数;c.对提取的梅尔倒普系数进行降维处理;所述降维处理具体为采用核主成份分析进行降维;d.将降维处理后的梅尔倒普系数特征信息输入模糊支持向量机分类器,模糊支持向量机分类器输出分类识别结果;所述模糊支持向量机分类器采用模糊支持向量算法对语音训练样本进行训练,具备语音情感分类识别能力;所述语音训练样本经过上述步骤a~c处理后,再用于训练模糊支持向量机分类器;所述模糊支持向量算法的具体步骤为:d1.假设训练样本S0={(x1,y1,s1)(x2,y2,s2),…,(xl,yl,sl)},其中(xl,yl,sl)中的xl为输入样本,yl为输入样本所对应的输出类别值,sl为输入样本的隶属度值,下标l为样本数;d2.在约束条件
下求解使目标函数0≤μi≤siC0,i=1,…,l.![]()
最小的
其中μi为Lagrange乘子,C0为惩罚因子,![]()
d3.计算最优权值
Y0为隐层输出向量;d4.对于待分类样本X0,计算分类判别函数
b是一个常数,j为类别编号,根据判别函数的取值,决定X0的归属类别,其具体方法为:d41.设语音情感有四类,包括高兴、生气、悲伤和平静,先分别对情感类别进行编号,具体为:高兴类别编号为1、生气类别编号为2、悲伤类别编号为3、平静类别编号为4;d42.对于输入向量x,如果fj(x)>0,则将x划分到第j类;如果fj(x)>0满足不止一个类别j(j=1,2,3,4),则将x划分到fj(x)(j∈(1,2,3,4))取最大值的那一类;如果fj(x)≤0,则将数据划分到fj(x)绝对值最小的那个类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410331505.6/,转载请声明来源钻瓜专利网。