[发明专利]一种基于歌词的歌曲检索系统及其检索方法有效
申请号: | 201210555192.3 | 申请日: | 2012-12-19 |
公开(公告)号: | CN103885949B | 公开(公告)日: | 2017-07-07 |
发明(设计)人: | 赵庆卫;颜永红;吴晓;潘接林 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京法思腾知识产权代理有限公司11318 | 代理人: | 杨小蓉,杨青 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于歌词的歌曲检索系统,包括语音识别引擎,用于将用户输入的原始语音数据转化为文本识别结果;检索关键词选取模块,用于将文本识别结果中的部分词选出作为检索关键词;歌词定位模块,用于根据关键词在歌词库中定位候选歌曲的位置,得到候选定位点;以及候选歌曲精确匹配模块,用于在所述候选定位点中选出最佳的N个歌曲并将其返回给用户。本发明还提供了一种相应的基于歌词的歌曲检索方法。本发明能够通过用户说出的一两句歌词来检索到他想要的歌曲,拓展了用户检索歌曲的模式,满足用户多样性检索的需求。本发明的歌词输入方式便捷,在一些打字不方便的设备使用优势更加明显。并且,本发明识别正确率高,识别速度快。 | ||
搜索关键词: | 一种 基于 歌词 歌曲 检索系统 及其 检索 方法 | ||
【主权项】:
一种基于歌词的歌曲检索系统,包括:基于歌词库信息建立正向索引表和反向索引表:所述歌词库信息包括歌名和歌词;正向索引的数据结构ForwardIdx中包括一个头以及头信息,然后是歌名,歌名后跟的是此歌曲中的歌词;反向索引数据结构ReverseIdx中包含一个头以及相对应的头信息,然后跟的是一个词以及对应此词一系列的命中信息,每个命中信息包含两部分信息:歌曲id和pos;歌曲id是指此词在歌曲中的位置,pos指出此词出现的位置;语音识别引擎,用于将用户输入的原始语音数据转化为文本识别结果;检索关键词选取模块,用于将文本识别结果中的部分词选出作为检索关键词;歌词定位模块,用于根据关键词在歌词库中定位候选歌曲的位置,得到候选定位点;以及候选歌曲精确匹配模块,用于在所述候选定位点中选出最佳的N个歌曲并将其返回给用户;所述歌词定位模块的具体实现过程为:31)用检索关键词模块选出的所有检索关键词构成候选词集合;32)基于所述候选词集合,查找包含候选词集合所有的候选词的歌曲;如果找到,则直接进入候选歌曲精确匹配模块;如果没有找到,则进入33);所述查找包含候选词集合所有的候选词的歌曲的过程为:用候选词集合中的第一个元素,去查反向索引表,依次查命中信息,因为词的后边的每一个命中信息都包含有歌曲名和歌词在歌曲中所在的位置,所以对查到的命中信息进行基于正向索引的检索,即按照每一个命中信息查找正向索引表,如果找到的歌曲包含候选词集合所有的候选词;33)在候选词集合中去掉一个元素得到该候选词集合的子集,基于该子集,查找包含该子集所有的候选词的歌曲,如果找到,则直接进入候选歌曲精确匹配模块;如果没有找到,则基于去掉2~3个元素的候选词集合的子集继续查找,这样,用子集逐渐搜索,从而找出多个候选定位点,然后进入候选歌曲精确匹配模块。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210555192.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗血虚证型产后身痛的中药
- 下一篇:一种缓存处理方法及装置