[发明专利]重叠语音检测方法和系统有效

申请号：	201110053946.0	申请日：	2011-03-07
公开（公告）号：	CN102682760A	公开（公告）日：	2012-09-19
发明（设计）人：	尹悦燕;鲁耀杰;王磊;史达飞;郑继川	申请（专利权）人：	株式会社理光
主分类号：	G10L11/00	分类号：	G10L11/00
代理公司：	北京市柳沈律师事务所 11105	代理人：	黄小临
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种重叠语音的自动检测方法和系统，该方法采用贝叶斯信息准则确定重叠语音的多个语音片段中仅仅包含单独说话人语音的语音片段，并为属于同一说话人的语音片段赋予同一个标识。从各个属于同一类语音片段中随机选择各类语音片段的采样数据进行合并获得能够体现所有语音重叠的可能的各种合并结果。然后基于所获得单人说话的语音片段和通过合并获得的多人说话的重叠语音片段建立单人语音片段模型和重叠语音片段模型，最后采用单人语音片段模型和重叠语音片段模型来检测各个语音片段，并基于检测结果来标注所述语音片段。
搜索关键词：	重叠语音检测方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一个重叠语音的自动检测方法，包括：输入语音；将所输入的语音分割为多个语音片段；丢弃所述多个语音片段中仅仅包含静音或噪声的非语音片段；基于贝叶斯信息准则，从丢弃了非语音片段的剩余多个语音片段中确定其中仅仅包含单独说话人语音的语音片段；基于至底向上聚类法，为属于同一说话人的语音片段赋予同一个标识，从而将多个属于同一说话人的语音片段聚类为一类；从各个属于同一说话人的同一类语音片段中随机选择各类语音片段的采样数据并进行合并处理，使得所获得的各种合并结果能够体现所有语音重叠的可能；基于所获得单人说话的语音片段和通过合并获得的多人说话的语音重叠片段建立单人语音片段模型和重叠语音片段模型；采用所获得的单人语音片段模型和重叠语音片段模型来检测所输入语音的多个分割的语音片段，并基于检测结果来标注所述多个分割语音片段。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于株式会社理光，未经株式会社理光许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201110053946.0/，转载请声明来源钻瓜专利网。

上一篇：一种基于电压越限概率的含风电场电网无功优化方法
下一篇：宫颈液基细胞学自动筛查方法和系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L11-00 不限定于G10L 15/00至G10L 21/00单独一组中的语音或音频特征的测定或检测
G10L11-02 .检测有无语音信号
G10L11-04 .语音信号的音调测定
G10L11-06 .语音信号的浊音和清音之间的鉴别

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]重叠语音检测方法和系统有效

专利文献下载