[发明专利]声音检索装置以及声音检索方法有效
申请号: | 201510972004.0 | 申请日: | 2015-12-22 |
公开(公告)号: | CN105718503B | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 富田宽基 | 申请(专利权)人: | 卡西欧计算机株式会社 |
主分类号: | G06F16/63 | 分类号: | G06F16/63;G10L25/54 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 范胜杰;王立杰 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种声音检索装置以及声音检索方法。变换部(112)将检索字符串变换为音素串。语速信息取得部(114)取得与检索对象的声音信号的语速对应的语速信息。时间长度变更部(115)根据语速信息变更音素的平均持续时间长度。时间长度导出部(116)使用变更后的持续时间长度,导出与检索字符串对应的声音的发声时间长度。区间指定部(117)指定多个检索对象的声音信号的似然取得区间。似然取得部(121)取得表示似然取得区间是发出与检索字符串对应的声音的区间的似然度的似然。确定部(127)根据对于选择出的似然取得区间分别取得的似然,确定从检索对象的声音信号中推定发出了与检索字符串对应的声音的推定区间。 | ||
搜索关键词: | 声音 检索 装置 以及 方法 | ||
【主权项】:
1.一种声音检索装置,该声音检索装置特征在于,具备:记录单元,其记录检索对象的声音信号;变换单元,其将检索字符串变换为音素串;时间长度取得单元,其从存储有与音素相关的持续时间长度数据的数据库取得由上述变换单元变换的音素串中包括的各个音素的持续时间长度;语速信息取得单元,其取得由用户指定的与语速相关的信息;时间长度变更单元,其根据上述语速信息取得单元取得的与语速相关的信息,变更上述时间长度取得单元取得的各个音素的持续时间长度;时间长度导出单元,其根据由上述时间长度变更单元变更的各个音素的持续时间长度,导出与上述检索字符串对应的声音发声时间长度;区间指定单元,其在上述检索对象的声音信号的时间长度中指定多个上述时间长度导出单元导出的发声时间长度的区间作为似然取得区间;似然取得单元,其取得似然,该似然表示上述区间指定单元指定的似然取得区间是发出与上述检索字符串对应的声音的区间的似然度;以及确定单元,其根据上述似然取得单元针对由上述区间指定单元指定的似然取得区间分别取得的似然,确定从检索对象的声音信号中推定发出了与上述检索字符串对应的声音的推定区间。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卡西欧计算机株式会社,未经卡西欧计算机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510972004.0/,转载请声明来源钻瓜专利网。
- 上一篇:展会推荐方法和装置
- 下一篇:相册实现方法和装置以及智能终端