[发明专利]一种基于随机卷积神经网络的高分辨率图像场景分类方法在审

申请号：	201610628128.1	申请日：	2016-08-03
公开（公告）号：	CN106250931A	公开（公告）日：	2016-12-21
发明（设计）人：	杜博;张帆;张良培	申请（专利权）人：	武汉大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	武汉科皓知识产权代理事务所(特殊普通合伙)42222	代理人：	严彦
地址：	430072 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于随机卷积神经网络的高分辨率图像场景分类方法，包括数据去均值，获得待分类图像集和训练图像集；模型共享的参数库随机初始化；计算待分类图像集和训练图像集的负梯度方向；训练基础卷积神经网络模型，训练基础卷积神经网络模型的权重；更新函数预测，得到加和模型；迭代达到最大训练次时，利用加和模型对待分类图像集进行识别。本发明使用深度卷积网络对特征进行层次化学习，利用梯度提升方法进行模型的聚合学习，用来克服单个模型容易陷入局部最优解问题，同时提高网络泛化能力；在模型训练过程中，加入了随机参数共享机制，提高模型的训练效率，可以在合理的时间代价下实现对特征的层次化学习，学习到的特征在场景识别中更具有鲁棒性。
搜索关键词：	一种基于随机卷积神经网络高分辨率图像场景分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于随机卷积神经网络的高分辨率图像场景分类方法，其特征在于，包括以下步骤：步骤a，数据去均值，获得待分类图像集和训练图像集；步骤b，模型共享的参数库随机初始化；步骤c，计算步骤a中所得待分类图像集和训练图像集的负梯度方向，实现方式如下，设图像集x是输入数据，y是对应x的类别标签，N是数据个数，i是数据编号，首先令初始化输出函数f0(x)＝0,k＝1,...,K，t＝1，其中f0(x)是非线性函数f(x)的初始函数，k是类别个数，共K个类别，t为迭代次数，计算优化函数Ψ(y,f(x))如下，pk(x)=exp(f(k)(x))/Σk=1Kexp(f(k)(x))---(1)]]>Ψ(y,f(x))=-Σk=1Kyklogpk(x)---(2)]]>其中f(k)(x)表示输出函数的第k个类别的输出值，pk(x)表示样本x属于第k个类别的概率，yk表示样本x是否为第k个类别，如果是则为1，不是则为0；然后利用优化函数计算负梯度方向如下，-gt(x)=-[∂Ψ(y,f(x))∂f(x)]f(x)=f^t-1(x)=y-p(x)---(3)]]>其中，表示第t‑1个f(x)的估计函数，p(x)表示样本x的各类别输出概率；第一次执行步骤c时，f(x)＝f0(x)；后续执行步骤c时，f(x)为上一次迭代得到的估计函数；步骤d，训练基础卷积神经网络模型，实现方式如下，首先从步骤b所得共享的参数库中随机选取一组卷积神经网络的参数组合θt，构成一个基础卷积神经网络模型h(x,θt)，h(x,θt)=Σi=1N(12||h(x,θt)-gt(x)||2)+λΣl=1Lsum(||θ(l)||2)---(4)]]>其中θ(l)是第l个特征提取阶段的网络参数，设共L个特征提取阶段，l＝1,2,…L，θ表示所有阶段的网络参数，θt是第t个非线性函数f(x)的网络参数θ，sum(.)指求和；然后基于步骤a所得的训练图像集，利用传统的反向误差传播算法和步骤c得到的负梯度方向，来最小化基础卷积神经网络模型h(x,θt)的误差，并对h(x,θt)进行训练，得到最优的参数组合θt，更新卷积神经网络参数并存入对应阶段参数库；步骤e，训练基础卷积神经网络模型的权重，实现方式如下，利用步骤d得到的基础卷积神经网络模型h(x,θt)和函数估计计算模型权重如下，ρt,k=argminρΣi=1NΣk=1KΨ(yk,f^t-1,k+ρt,khk(xi,θ))---(5)]]>其中，ρt,k是第t个非线性函数f(x)的第k类别权重，表示第t‑1个f(x)的估计函数，表示第k类别的hk(xi,θ)表示第i个数据xi第k类别的优化函数；权重更新为ρt,k＝ρt‑1,k‑▽ρ，其中▽ρt,k＝‑(1(c＝k)·hc(x)‑pk(x)·hk(x))，▽ρ表示权值梯度，▽ρt,k表示第t次迭代第k类别的权值梯度，c代表某个样本的标签，指示函数1(c＝k)表示如果c等于k则取值为1，否则为0，k＝1,2,…K；hc(x)表示第c类别的基础卷积神经网络模型h(x,θt)输出值，hk(x)表示第k类别的基础卷积神经网络模型h(x,θt)输出值；步骤f，更新函数预测，得到加和模型，公式如下，f^t←f^t-1+λρth(x,θt)---(6)]]>其中，ρt是基础卷积神经网络的最佳梯度下降乘子，h(x,θt)为基础卷积神经网络模型，λ为缩放因子，且λ＝1/(M+1)；步骤g，判断迭代是否达到最大训练次数，若达到最大训练次数则转步骤h；否则令t＝t+1，转步骤c，重新计算负梯度，并继续从共享的参数库中随机选取另一组参数组合，构成一个基础卷积神经网络模型，进行训练；步骤h，利用步骤f中所得的加和模型对步骤a所得的待分类图像集进行识别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉大学，未经武汉大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610628128.1/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于随机卷积神经网络的高分辨率图像场景分类方法在审

专利文献下载