[发明专利]一种基于多人说话的声纹识别方法在审

专利信息
申请号: 201610024134.6 申请日: 2016-01-14
公开(公告)号: CN106971737A 公开(公告)日: 2017-07-21
发明(设计)人: 祝铭明 申请(专利权)人: 芋头科技(杭州)有限公司
主分类号: G10L17/08 分类号: G10L17/08;G10L17/14
代理公司: 上海申新律师事务所31272 代理人: 党蕾
地址: 310000 浙江省杭州市余杭区*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于多人说话的声纹识别方法,属于生物识别技术领域;该声纹识别方法,可在多人同时说话时,可对声源进行分解,获取每个说话人的语音,将每个人的语音与预设的频段进行匹配,根据匹配相似度识别出需要识别的说话人的语音,在对该语音进行声纹识别,计算量较小,能够节省存储和计算资源,识别的准确率高,并且克服了基于概率统计的建模方法存在的问题,适合于系统资源有限的智能系统使用。同时预先设置了表示儿童的说话人的第一频率以及表示成年的说话人的第二频率并分别进行比较,进一步提升了基于多人说话的声纹识别的准确度。
搜索关键词: 一种 基于 说话 声纹 识别 方法
【主权项】:
一种基于多人说话的声纹识别方法,其特征在于:预设一第一频段以及一第二频段,所述第一频段高于所述第二频段,包括下述步骤:步骤S1,接收多个说话人的声源;步骤S2,对所述声源进行分解,以分别获取每个人的语音;步骤S3,将每个人的所述语音均与所述第一频段进行匹配,以获取相应的匹配关联度,或者将每个人的所述语音均与所述第二频段进行匹配,以获取相应的匹配关联度;步骤S4,提取最大的所述匹配关联度对应的所述语音,将所述语音与所述第一频段或者所述第二频段进行拟合;步骤S5,将分别处于所述第一频段或者所述第二频段下的不同背景、不同人声的语音分割为特定长度的识别区段;步骤S6,对每个所述识别区段做特征变换后得到相应的多个识别特征,并采用关联于所有所述识别区段的所有所述识别特征分别构成对应所述第一频段的识别特征空间,或者对应所述第二频段的所述识别特征空间;步骤S7,将所述识别特征空间划分成复数个子空间,并以描述信息每个被划分的所述子空间,以及分别对每个所述子空间赋予一对应的序号;步骤S8,分别将处于所述第一频段或者处于所述第二频段的关联于训练模型的每条训练语句做特征变换后得到包括相应的时序特征点的时序特征点集,每个所述时序特征点分别被分配入同频段下的各个所述子空间,根据每个所述时序特征点对应的所述子空间的序号分别形成关联于所述第一频段或者所述第二频段的第一序列,并进而形成对应的训练识别特征;步骤S9,分别将处于所述第一频段或者处于所述第二频段的关联于测试模型的每条测试语句做特征变换后得到所述时序特征点集,每个所述时序特征点分别被分配入各个所述子空间,根据每个所述时序特征点对应的所述子空间的序号分别形成关联于所述第一频段或者所述第二频段的第二序列,并进而形成对应的测试识别特征;步骤S10,对比关联于所述第一频段的所述训练识别特征与所述测试识别特征是否相似,并根据对比结果处理得到基于多人说话的声纹识别的确认结果,或者对于关联于所述第二频段的所述训练识别特征与所述测试识别特征是否相似,并根据对比结果处理得到基于多人说话的声纹识别的确认结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610024134.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top