[发明专利]基于深度神经网络的端到端的图像多字符定位和匹配方法在审

申请号：	201711025494.9	申请日：	2017-10-27
公开（公告）号：	CN107657256A	公开（公告）日：	2018-02-02
发明（设计）人：	费行健;潘嵘	申请（专利权）人：	中山大学
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/62;G06N3/04;G06N3/08
代理公司：	广州粤高专利商标代理有限公司44102	代理人：	林丽明
地址：	510275 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于深度神经网络的端到端的图像多字符定位和匹配方法，其具有以下有益效果1）方法的运行效率更高，整个方法流程在深度神经网络训练好之后，每次使用，只需要经过一次深度神经网络的前向传播计算，而不像现有方法有多个神经网络需计算多次，还有用聚类算法做字符提取等比较耗时的步骤。2）方法的准确率更高。整个方法流程就是直接优化最终目标的准确率，通过深度神经网络可以很好的做到这一点。而现有技术，最终目标的准确率依赖于各个步骤流程的准确率，由于只能分别优化各个步骤的准确率，没法直接优化最终目标，导致准确率较低，也很难改进。
搜索关键词：	基于深度神经网络端到端图像多字定位匹配方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

基于深度神经网络的端到端的图像多字符定位和匹配方法，其特征在于：包括有以下步骤：S1.令查询图片与对应的被查询图片为一对图片对，收集大量的图片对作为数据集，并对图片对中查询图片中的字符在被查询图片中的位置进行标注；S2.将数据集按照一定比例划分为三部分，分别为训练集、验证集和测试集；S3.搭建深度神经网络，利用训练集中的图片对作为输入对深度神经网络进行训练，并利用Adam算法对深度神经网络进行优化；S4.使用验证集中的图片对作为输入对优化后的深度神经网络进行验证，深度神经网络输出图片对中查询图片中的字符在被查询图片中的定位及匹配结果，由于步骤S1已经对图片对中查询图片中的字符在被查询图片中的位置进行标注，因此可计算深度神经网络在验证集上的准确率；S5.重复步骤S3~S4直至深度神经网络在验证集上的准确率满足设定的条件；S6.将测试集中的图片对作为输入对步骤S5训练好的深度神经网络进行测试，并根据深度神经网络输出的测试结果对深度神经网络的在测试集上的准确率进行统计，作为对深度神经网络的评估结果；S7.对于新的一对图片对，将其作为深度神经网络的输入，即可通过深度神经网络得到图片对中查询图片中的字符在被查询图片中的定位及匹配结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中山大学，未经中山大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711025494.9/，转载请声明来源钻瓜专利网。

上一篇：一种新型底托板加工设备
下一篇：一种输电线路周边环境中地面隐患的检测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于深度神经网络的端到端的图像多字符定位和匹配方法在审

专利文献下载