[发明专利]一种基于长窗比例因子的回放语音攻击检测算法有效
申请号: | 201610220000.1 | 申请日: | 2016-04-11 |
公开(公告)号: | CN105913855B | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 王让定;陈亚楠;严迪群;金超;陶表犁;张立 | 申请(专利权)人: | 宁波大学 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/78 |
代理公司: | 33207 宁波天一专利代理有限公司 | 代理人: | 刘赛云;张晨<国际申请>=<国际公布>= |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于长窗比例因子的回放语音攻击检测算法,它是针对现有攻击者利用回放语音进入说话人识别系统,造成合法用户的权益受到损害而研发的防回放语音攻击的检测算法,该检测算法能够有效识别不同来源的回放语音,检测准确率高,将该检测算法模块加载到GMM‑UBM系统之后,提高了抵抗回放语音攻击的能力,使识别系统的等错误概率降低了32%,极大改善了识别系统的安全问题。 | ||
搜索关键词: | 一种 基于 比例 因子 回放 语音 攻击 检测 算法 | ||
【主权项】:
1.一种基于长窗比例因子的回放语音攻击检测算法,其特征在于该回放语音攻击检测算法包括如下步骤:/n步骤一、构建语音库:语音库的构建主要分为原始语音和回放语音;在参与者阅读语料的同时,将偷录设备和采集设备分别打开到正常录制功能下,录制参与者的语音内容,并将采集设备此时采集到的语音暂称为原始语音;在同样环境下,将偷录设备采集到的语音经回放音响回放,并使用采集设备采集回放语音,该采集设备采集到的语音暂称为回放语音;/n步骤二、特征提取:通过lame_3.99.5工具对原始语音和回放语音进行不同码率的MP3编码,而后在MP3编码参数中分别提取原始语音和回放语音的长窗比例因子;由于原始语音和回放语音都是一维时变信号,故对于不同的时长的语音片段,得到的特征维数并不一致,这将给构建训练模型、识别过程中造成了一定的难度,所以为了消除时间对特征维数的影响,将计算比例因子的时间统计平均,/n设 为比例因子,有 /n其中,/n 表示为第i帧,第j个比例因子带上对应的比例因子;/n 表示为第j个比例因子带上比例因子时间上的统计平均;/n通过以上步骤初步得到21维特征集;/n步骤三、特征集的选择:根据步骤二得到的21维特征集是否全部有效,需要进一步对其进行统计,考虑到特征集的离散性及分类的目的,最终将特征集的选择分为三种:第一种为筛选出的2、10、11、21号4维特征;第二种为2、10号的2维特征;第三种为10号1维特征,将这三种特征集分别暂称为:特征集 、特征集 、特征集 ;在不同码率下,将三种特征集分别放入LibSVM进行构建模型和测试,并根据测试结果选择64kbps码率下特征集 作为最终回放语音检测模块使用的特征集;/n步骤四、将步骤一构建的回放语音在GMM-UBM进行测试,出现较高的等错误概率,说明回放语音完全有能力对识别系统攻击成功,并将该回放语音检测算法加载到语音识别系统上,以提高语音识别系统抵抗回放语音的能力。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610220000.1/,转载请声明来源钻瓜专利网。
- 上一篇:贵州山地盖膜集水栽培结构
- 下一篇:一种立体种植架