[发明专利]一种将语音转换成唇形的方法、系统、装置和存储介质有效
申请号: | 202010079894.3 | 申请日: | 2020-02-04 |
公开(公告)号: | CN111370020B | 公开(公告)日: | 2023-02-14 |
发明(设计)人: | 黄桂芳;王伦基;叶俊杰;李权;任勇;韩蓝青 | 申请(专利权)人: | 清华珠三角研究院;赛业(广州)生物科技有限公司 |
主分类号: | G10L21/10 | 分类号: | G10L21/10;G10L25/24;G10L25/30;G10L19/02;G10L19/26;G06V40/20;G06V10/77;G06T13/20;G06T13/40 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 何文聪 |
地址: | 510530 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种将语音转换成唇形的方法、系统、装置和存储介质,所述方法包括:获取语音序列;利用训练好的生成对抗网络模型接收所述语音序列并进行处理;获取所述训练好的生成对抗网络模型输出的唇形图像。本发明通过训练生成对抗网络模型(GAN),并利用训练好的生成对抗网络模型将语音转换唇形,能够得到高质量、高分辨率的唇形图像;生成对抗网络模型采用的是一种无监督的学习方式训练,能够明显改善语音质量,减少语音失真,增强系统的鲁棒性;当持续输入变化的语音时,最终能够输出动态的唇形图像,能够提供流畅的视觉效果;同时,将生成的唇形图像与语音结合,能够合成高质量的人脸说话视频。本发明广泛应用于语音数据技术领域。 | ||
搜索关键词: | 一种 语音 转换 成唇形 方法 系统 装置 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华珠三角研究院;赛业(广州)生物科技有限公司,未经清华珠三角研究院;赛业(广州)生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010079894.3/,转载请声明来源钻瓜专利网。