[发明专利]语音查询的方法、装置、存储介质及终端设备有效
申请号: | 201810059882.7 | 申请日: | 2018-01-22 |
公开(公告)号: | CN108170859B | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 吴文权;刘占一;吴华 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/632 | 分类号: | G06F16/632 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 王珺;徐瑞红 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种语音查询的方法、装置、存储介质及终端设备,所述方法包括接收用户的语音查询请求;对所述语音查询请求进行语音识别,获取查询语句;对所述查询语句进行意图识别和对象识别,获得所述查询语句的查询意图和查询对象词语;其中,所述查询对象词语对应于至少一个查询对象;基于所述查询对象词语确定所述查询语句的查询对象;以及根据所述查询意图和所述查询语句的查询对象查询检索数据库,获得查询结果。采用本发明,能够提高查询的准确度。 | ||
搜索关键词: | 语音 查询 方法 装置 存储 介质 终端设备 | ||
接收用户的语音查询请求;
对所述语音查询请求进行语音识别,获取查询语句;
对所述查询语句进行意图识别和对象识别,获得所述查询语句的查询意图和查询对象词语;其中,所述查询对象词语对应于至少一个查询对象;
基于所述查询对象词语确定所述查询语句的查询对象;以及
根据所述查询意图和所述查询语句的查询对象查询检索数据库,获得查询结果。
2.如权利要求1所述的语音查询的方法,其特征在于,所述基于所述查询对象词语确定所述查询语句的查询对象,包括:判断所述查询对象词语对应的查询对象的数量是否大于1;
若是,则返回所述查询对象词语对应的所有查询对象给所述用户,以供所述用户进行选择确认;
接收所述用户返回的查询对象;以及
将接收到的查询对象作为所述查询语句的查询对象。
3.如权利要求1所述的语音查询的方法,其特征在于,所述对所述查询语句进行意图识别和对象识别,获得所述查询语句的查询意图和查询对象词语,包括:根据意图分类模型对所述查询语句进行识别,获得所述查询语句的查询意图;以及
根据所述查询意图和对象识别模型对所述查询语句进行识别,获得所述查询语句的查询对象词语。
4.如权利要求3所述的语音查询的方法,其特征在于,所述方法还包括:从所述检索数据库的检索日志中获取历史查询语句和基于所述历史查询语句的查询结果用户选择的访问地址;
根据正则表达式意图识别算法,识别所述历史查询语句的意图;
将已识别出意图的历史查询语句与其识别出的意图对应的意图词关联;
对于未识别出意图的历史查询语句,判断所述未识别出意图的历史查询语句对应的用户选择的访问地址与已识别出意图的历史查询语句对应的用户选择的该问地址是否存在有相同的访问地址;以及
若是,将所述未识别出意图的历史查询语句与存在有相同的访问地址的历史查询语句所关联的意图词进行关联;
将相互关联的历史查询语句和意图词组成数据对,并更新于训练数据库中;以及
根据更新后的训练数据库对所述意图分类模型进行训练更新。
5.如权利要求4所述的语音查询的方法,其特征在于,所述将所述关联的查询语句和意图词组成数据对,包括:将相互关联的历史查询语句和意图词中的历史查询语句进行结构化处理,获得具有句法特征和语义特征的历史查询语句;以及
将结构化处理后的历史查询语句与所述意图词组成数据对。
6.如权利要求5所述的语音查询的方法,其特征在于,在根据意图分类模型对所述查询语句进行识别之前,还包括:对所述查询语句进行结构化处理,获得具有句法特征和语义特征的查询语句。
7.如权利要求2所述的语音查询的方法,其特征在于,以语音信号形式返回所述查询对象词语对应的所有查询对象给所述用户以供所述用户进行选择确认,以及,所述方法还包括:以语音信号形式返回所述查询结果给所述用户。8.一种语音查询的装置,其特征在于,包括:语音查询接收模块,用于接收用户的语音查询请求;
查询语句获取模块,用于对所述语音查询请求进行语音识别,获取查询语句;
意图与对象识别模块,用于对所述查询语句进行意图识别和对象识别,获得所述查询语句的查询意图和查询对象词语;其中,所述查询对象词语对应于至少一个查询对象;
查询对象确认模块,用于基于所述查询对象词语确定所述查询语句的查询对象;以及
查询数据库模块,用于根据所述查询意图和所述查询语句的查询对象查询检索数据库,获得查询结果。
9.如权利要求8所述的语音查询的装置,其特征在于,所述查询对象确认模块包括:数量判断单元,用于判断所述查询对象词语对应的查询对象的数量是否大于1;
对象返回单元,用于若是,则返回所述查询对象词语对应的所有查询对象给所述用户,以供所述用户进行选择确认;
对象接收单元,用于接收所述用户返回的查询对象;以及
对象确认单元,用于将接收到的查询对象作为所述查询语句的查询对象。
10.如权利要求8所述的语音查询的装置,其特征在于,所述意图与对象识别模块还包括:意图识别单元,用于根据意图分类模型对所述查询语句进行识别,获得所述查询语句的查询意图;以及
对象识别单元,用于根据所述查询意图和对象识别模型对所述查询语句进行识别,获得所述查询语句的查询对象词语。
11.如权利要求10所述的语音查询的装置,其特征在于,所述装置还包括:日志获取模块,用于从所述检索数据库的检索日志中获取历史查询语句和基于所述历史查询语句的查询结果用户选择的访问地址;
初步意图识别模块,用于根据正则表达式意图识别算法,识别所述历史查询语句的意图;
第一关联模块,用于将已识别出意图的历史查询语句与其识别出的意图对应的意图词关联;
第二关联模块,用于对于未识别出意图的历史查询语句,判断所述未识别出意图的历史查询语句对应的用户选择的访问地址与已识别出意图的历史查询语句对应的用户选择的该问地址是否存在有相同的访问地址;以及若是,将所述未识别出意图的历史查询语句与存在有相同的访问地址的历史查询语句所关联的意图词进行关联;
训练数据更新模块,用于将相互关联的历史查询语句和意图词组成数据对,并更新于训练数据库中;以及
模型更新模块,用于根据更新后的训练数据库对所述意图分类模型进行训练更新。
12.一种实现语音查询的终端设备,其特征在于,所述终端设备包括:一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1‑7中任一所述的语音查询的方法。
13.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1‑7中任一所述的语音查询的方法。该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810059882.7/,转载请声明来源钻瓜专利网。