[发明专利]重叠语音检测方法和系统有效
申请号: | 201110053946.0 | 申请日: | 2011-03-07 |
公开(公告)号: | CN102682760A | 公开(公告)日: | 2012-09-19 |
发明(设计)人: | 尹悦燕;鲁耀杰;王磊;史达飞;郑继川 | 申请(专利权)人: | 株式会社理光 |
主分类号: | G10L11/00 | 分类号: | G10L11/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 黄小临 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种重叠语音的自动检测方法和系统,该方法采用贝叶斯信息准则确定重叠语音的多个语音片段中仅仅包含单独说话人语音的语音片段,并为属于同一说话人的语音片段赋予同一个标识。从各个属于同一类语音片段中随机选择各类语音片段的采样数据进行合并获得能够体现所有语音重叠的可能的各种合并结果。然后基于所获得单人说话的语音片段和通过合并获得的多人说话的重叠语音片段建立单人语音片段模型和重叠语音片段模型,最后采用单人语音片段模型和重叠语音片段模型来检测各个语音片段,并基于检测结果来标注所述语音片段。 | ||
搜索关键词: | 重叠 语音 检测 方法 系统 | ||
【主权项】:
一个重叠语音的自动检测方法,包括:输入语音;将所输入的语音分割为多个语音片段;丢弃所述多个语音片段中仅仅包含静音或噪声的非语音片段;基于贝叶斯信息准则,从丢弃了非语音片段的剩余多个语音片段中确定其中仅仅包含单独说话人语音的语音片段;基于至底向上聚类法,为属于同一说话人的语音片段赋予同一个标识,从而将多个属于同一说话人的语音片段聚类为一类;从各个属于同一说话人的同一类语音片段中随机选择各类语音片段的采样数据并进行合并处理,使得所获得的各种合并结果能够体现所有语音重叠的可能;基于所获得单人说话的语音片段和通过合并获得的多人说话的语音重叠片段建立单人语音片段模型和重叠语音片段模型;采用所获得的单人语音片段模型和重叠语音片段模型来检测所输入语音的多个分割的语音片段,并基于检测结果来标注所述多个分割语音片段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社理光,未经株式会社理光许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110053946.0/,转载请声明来源钻瓜专利网。