[发明专利]一种基于长窗比例因子的回放语音攻击检测算法有效

专利信息
申请号: 201610220000.1 申请日: 2016-04-11
公开(公告)号: CN105913855B 公开(公告)日: 2019-11-22
发明(设计)人: 王让定;陈亚楠;严迪群;金超;陶表犁;张立 申请(专利权)人: 宁波大学
主分类号: G10L25/03 分类号: G10L25/03;G10L25/78
代理公司: 33207 宁波天一专利代理有限公司 代理人: 刘赛云;张晨<国际申请>=<国际公布>=
地址: 315211 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于长窗比例因子的回放语音攻击检测算法,它是针对现有攻击者利用回放语音进入说话人识别系统,造成合法用户的权益受到损害而研发的防回放语音攻击的检测算法,该检测算法能够有效识别不同来源的回放语音,检测准确率高,将该检测算法模块加载到GMM‑UBM系统之后,提高了抵抗回放语音攻击的能力,使识别系统的等错误概率降低了32%,极大改善了识别系统的安全问题。
搜索关键词: 一种 基于 比例 因子 回放 语音 攻击 检测 算法
【主权项】:
1.一种基于长窗比例因子的回放语音攻击检测算法,其特征在于该回放语音攻击检测算法包括如下步骤:/n步骤一、构建语音库:语音库的构建主要分为原始语音和回放语音;在参与者阅读语料的同时,将偷录设备和采集设备分别打开到正常录制功能下,录制参与者的语音内容,并将采集设备此时采集到的语音暂称为原始语音;在同样环境下,将偷录设备采集到的语音经回放音响回放,并使用采集设备采集回放语音,该采集设备采集到的语音暂称为回放语音;/n步骤二、特征提取:通过lame_3.99.5工具对原始语音和回放语音进行不同码率的MP3编码,而后在MP3编码参数中分别提取原始语音和回放语音的长窗比例因子;由于原始语音和回放语音都是一维时变信号,故对于不同的时长的语音片段,得到的特征维数并不一致,这将给构建训练模型、识别过程中造成了一定的难度,所以为了消除时间对特征维数的影响,将计算比例因子的时间统计平均,/n设为比例因子,有/n其中,/n 表示为第i帧,第j个比例因子带上对应的比例因子;/n 表示为第j个比例因子带上比例因子时间上的统计平均;/n通过以上步骤初步得到21维特征集;/n步骤三、特征集的选择:根据步骤二得到的21维特征集是否全部有效,需要进一步对其进行统计,考虑到特征集的离散性及分类的目的,最终将特征集的选择分为三种:第一种为筛选出的2、10、11、21号4维特征;第二种为2、10号的2维特征;第三种为10号1维特征,将这三种特征集分别暂称为:特征集、特征集、特征集;在不同码率下,将三种特征集分别放入LibSVM进行构建模型和测试,并根据测试结果选择64kbps码率下特征集作为最终回放语音检测模块使用的特征集;/n步骤四、将步骤一构建的回放语音在GMM-UBM进行测试,出现较高的等错误概率,说明回放语音完全有能力对识别系统攻击成功,并将该回放语音检测算法加载到语音识别系统上,以提高语音识别系统抵抗回放语音的能力。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610220000.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top