[发明专利]一种图说生成方法及装置在审
申请号: | 201710283733.4 | 申请日: | 2017-04-26 |
公开(公告)号: | CN108805260A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 黄欢;赵刚 | 申请(专利权)人: | 上海荆虹电子科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F17/27;G06F17/30;G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 201203 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种图说生成方法及装置。该方法包括:采用预先训练的卷积神经网络提取图文数据库中训练集的图像的全局特征;对图文数据库中训练集的图像对应的描述语句进行编码得到描述语句特征;将训练集的图像的全局特征以及描述语句特征输入至递归神经网络,对递归神经网络进行训练;根据递归神经网络的输出构建损失函数,根据损失函数对递归神经网络的参数进行优化;采用预先训练的卷积神经网络提取目标图像的全局特征,将目标图像的全局特征输入至递归神经网络,生成与目标图像对应的描述语句。本发明实施例采用递归神经网络作为语言模型,避免了现有技术生成的描述语句形式单一的缺陷,能够针对目标图像生成描述丰富、长短可变的描述语句。 | ||
搜索关键词: | 递归神经网络 语句 全局特征 目标图像 训练集 卷积神经网络 图文数据库 损失函数 图像 提取目标图像 特征输入 语句形式 语言模型 可变的 构建 输出 优化 | ||
【主权项】:
1.一种图说生成方法,其特征在于,包括:采用预先训练的卷积神经网络提取图文数据库中训练集的图像的全局特征;对所述图文数据库中训练集的图像对应的描述语句进行编码得到描述语句特征;将所述训练集的图像的全局特征以及所述描述语句特征输入至递归神经网络,对所述递归神经网络进行训练;根据所述递归神经网络的输出构建损失函数,根据所述损失函数对所述递归神经网络的参数进行优化;采用所述预先训练的卷积神经网络提取目标图像的全局特征,将所述目标图像的全局特征输入至所述递归神经网络,生成与所述目标图像对应的描述语句。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海荆虹电子科技有限公司,未经上海荆虹电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710283733.4/,转载请声明来源钻瓜专利网。