[发明专利]基于人类视觉感知的图像识别方法有效

专利信息
申请号: 201610427497.4 申请日: 2016-06-16
公开(公告)号: CN106127230B 公开(公告)日: 2019-10-01
发明(设计)人: 郭越;王晓峰;张恒振 申请(专利权)人: 上海海事大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 上海三和万国知识产权代理事务所(普通合伙) 31230 代理人: 陈伟勇
地址: 201306 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于人类视觉的图像识别方法。该方法在深度学习与人类视觉的基础上构建了一个能够跨问题域识别的图像识别结构。应用这个模型结构,可以对一个模型对多个问题域的图像进行识别,是对人类视觉系统的进一步模拟。本方法利用人类视觉感知的性质既HMAX的方法直接对原始图像进行特征提取,减少了繁复的预处理步骤,提高了方法的计算效率及可行性。通过SDA的方法减少了深度学习中的参数数目,提高了算法的通用性。以提高一般前向BP的训练性能。从实际的实验结果来看,运用该方法的分类准确率也高于其它分类方法。因此,该方法是一种高效可行性的图像识别方法,在图像识别领域具有普遍的适用性。
搜索关键词: 基于 人类 视觉 感知 图像 识别 方法
【主权项】:
1.一种基于人类视觉感知的图像识别方法,包括以下步骤:一、原始训练图像输入,生成模块训练子图集合获取原始训练图像;对于尺寸较大的原始图像,对图像进行切割,将一景图像分割成分辨率大小为200*200的模块训练子图集合;二、应用训练样本生成HMAX特征矩阵输入为模块训练图片集合,Gabor滤波器的方向参数为8个(0,π/4,π/2,3π/4,π,5π/4,3π/2,7π/4),共16个尺度,共128个滤波器相应图,Gabor函数中高宽比设置为0.7;Gaussian因子的标准差与波长的比值设置为0.65;角度数∈[0,2π)即本方法选取8个方向的朝向;相位补偿设为0;HMAX训练阶段模板数量为10;输出为HMAX特征矩阵;三、SDA训练输入原始训练图像HMAX特征矩阵,使用一定数量的带标签的训练样本通过前向反馈网络进行训练,训练函数为SAE(TrainingSet,G1vAll),TrainingSet为测试样本集,G1vAll为类别数,具体参数为:SAE的层数为3层(picSize,100),激励函数为sigma函数,SAE的迭代次数为2,训练批量大小为100,学习率为1,加噪声系数为0.5;输出经SDA训练得到的网络权值;四、初始化FFNN用经训练得到的网络权值做为FFNN网络的初始权,层数为[picsize,100,10],激励函数为sigma函数,迭代次数为1,批量大小为100;五、训练FFNN输入原始训练图像HMAX特征矩阵对FFNN网络进行训练,输出FFNN的网络权值;六、生成测试验证图像的模块训练子图集合获取原始测试验证图像;对于尺寸较大的原始图像,对图像进行简单的切割,将一景图像分割分辨率大小为200*200的测试图像模块训练子图集合;七、生成测试图像的模块训练子图集合的HMAX特征矩阵,方法同第二步;八、FFNN分类输入:应用训练好的FFNN网络权值,对第七步生成的HMAX特征矩阵进行分类,输出[lable,Score],其中lablel为类别标签,Score为类别置信度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610427497.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top