[发明专利]一种可实时反馈用户朗读进度的语音跟踪方法有效

申请号：	201210483056.8	申请日：	2012-11-24
公开（公告）号：	CN103035244A	公开（公告）日：	2013-04-10
发明（设计）人：	潘颂声;赵乾;吴玲;何春江;王兵;朱群	申请（专利权）人：	安徽科大讯飞信息科技股份有限公司
主分类号：	G10L15/30	分类号：	G10L15/30
代理公司：	北京科迪生专利代理有限责任公司 11251	代理人：	成金玉
地址：	230088 安徽省***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种可实时反馈用户朗读进度的语音跟踪方法，（1）输入待跟踪的文本；（2）根据所述文本搭建跟踪解码网络，并将跟踪解码网络、声学模型传给解码器；（3）实时提取声学特征序列，并实时传递给解码器；（4）解码器实时判断用户朗读的进度，同时检测用户是否朗读了文本外的内容；（5）实时显示跟踪进度。本发明解决了用户不按正常顺序朗读而无法正常跟踪的问题，提高了系统的抗环境噪音干扰能力，使语音朗读跟踪功能真正达到实用的水平。
搜索关键词：	一种实时反馈用户朗读进度语音跟踪方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种可实时反馈用户朗读进度的语音跟踪方法，其特征在于实现步骤如下：（1）输入待跟踪的文本，并进行文本处理；（2）根据所述文本搭建跟踪解码网络，并将跟踪解码网络、声学模型传给解码器；所述声学模型是语音识别的基础数学模型，模型单元是基础数学模型的组成部分，可以是音素、音节或字；（3）实时提取声学特征序列，所述声学特征序列是指声学特征中多个单元，每一个单元称为一帧，并实时传递给解码器；所述声学特征是描述短时语音本质特征的一组值；（4）解码器基于步骤（3）中输入的声学特征序列，在跟踪解码网络中对所有可能的网络路径进行搜索，每隔一定时间检查当前的搜索路径，并找出当前概率最优路径，基于此最优路径判断用户朗读进度，获取当前朗读内容在文本中的位置和状态；同时结合最大路径中发音单元的概率信息检测用户是否朗读了文本外的内容；（5）根据步骤（4）中反馈的当前朗读内容在文本中的位置和状态，实时显示跟踪进度；所述步骤（2）中搭建跟踪解码网络的过程如下：（21）获取文本处理步骤中得到的朗读文本模型单元序列，所述模型单元序列是指多个模型单元按顺序排列在一起称为模型单元序列；（22）计算节点和连接弧的数目，分配内存，即根据模型单元序列个数计算跟踪解码网络中的空节点、朗读文本模型单元节点、无关语音模型单元节点及连接弧个数，并为这些节点和弧分配存储单元；（23）构造无关语音吸收网络，即将无关语音吸收网络中的关联节点用弧进行连接；（24）将朗读文本模型单元节点、空节点、无关语音吸收网络通过弧连接。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司，未经安徽科大讯飞信息科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201210483056.8/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种可实时反馈用户朗读进度的语音跟踪方法有效

专利文献下载