[发明专利]一种基于多人说话的声纹识别方法在审

申请号：	201610024134.6	申请日：	2016-01-14
公开（公告）号：	CN106971737A	公开（公告）日：	2017-07-21
发明（设计）人：	祝铭明	申请（专利权）人：	芋头科技（杭州）有限公司
主分类号：	G10L17/08	分类号：	G10L17/08;G10L17/14
代理公司：	上海申新律师事务所31272	代理人：	党蕾
地址：	310000 浙江省杭州市余杭区***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于多人说话的声纹识别方法，属于生物识别技术领域；该声纹识别方法，可在多人同时说话时，可对声源进行分解，获取每个说话人的语音，将每个人的语音与预设的频段进行匹配，根据匹配相似度识别出需要识别的说话人的语音，在对该语音进行声纹识别，计算量较小，能够节省存储和计算资源，识别的准确率高，并且克服了基于概率统计的建模方法存在的问题，适合于系统资源有限的智能系统使用。同时预先设置了表示儿童的说话人的第一频率以及表示成年的说话人的第二频率并分别进行比较，进一步提升了基于多人说话的声纹识别的准确度。
搜索关键词：	一种基于说话声纹识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于多人说话的声纹识别方法，其特征在于：预设一第一频段以及一第二频段，所述第一频段高于所述第二频段，包括下述步骤：步骤S1，接收多个说话人的声源；步骤S2，对所述声源进行分解，以分别获取每个人的语音；步骤S3，将每个人的所述语音均与所述第一频段进行匹配，以获取相应的匹配关联度，或者将每个人的所述语音均与所述第二频段进行匹配，以获取相应的匹配关联度；步骤S4，提取最大的所述匹配关联度对应的所述语音，将所述语音与所述第一频段或者所述第二频段进行拟合；步骤S5，将分别处于所述第一频段或者所述第二频段下的不同背景、不同人声的语音分割为特定长度的识别区段；步骤S6，对每个所述识别区段做特征变换后得到相应的多个识别特征，并采用关联于所有所述识别区段的所有所述识别特征分别构成对应所述第一频段的识别特征空间，或者对应所述第二频段的所述识别特征空间；步骤S7，将所述识别特征空间划分成复数个子空间，并以描述信息每个被划分的所述子空间，以及分别对每个所述子空间赋予一对应的序号；步骤S8，分别将处于所述第一频段或者处于所述第二频段的关联于训练模型的每条训练语句做特征变换后得到包括相应的时序特征点的时序特征点集，每个所述时序特征点分别被分配入同频段下的各个所述子空间，根据每个所述时序特征点对应的所述子空间的序号分别形成关联于所述第一频段或者所述第二频段的第一序列，并进而形成对应的训练识别特征；步骤S9，分别将处于所述第一频段或者处于所述第二频段的关联于测试模型的每条测试语句做特征变换后得到所述时序特征点集，每个所述时序特征点分别被分配入各个所述子空间，根据每个所述时序特征点对应的所述子空间的序号分别形成关联于所述第一频段或者所述第二频段的第二序列，并进而形成对应的测试识别特征；步骤S10，对比关联于所述第一频段的所述训练识别特征与所述测试识别特征是否相似，并根据对比结果处理得到基于多人说话的声纹识别的确认结果，或者对于关联于所述第二频段的所述训练识别特征与所述测试识别特征是否相似，并根据对比结果处理得到基于多人说话的声纹识别的确认结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于芋头科技（杭州）有限公司，未经芋头科技（杭州）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610024134.6/，转载请声明来源钻瓜专利网。

上一篇：一种提升声纹识别准确度的方法和系统
下一篇：解压缩高阶高保真度立体声响复制信号表示的方法及装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于多人说话的声纹识别方法在审

专利文献下载