[发明专利]一种基于随机卷积神经网络的高分辨率图像场景分类方法在审
申请号: | 201610628128.1 | 申请日: | 2016-08-03 |
公开(公告)号: | CN106250931A | 公开(公告)日: | 2016-12-21 |
发明(设计)人: | 杜博;张帆;张良培 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙)42222 | 代理人: | 严彦 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于随机卷积神经网络的高分辨率图像场景分类方法,包括数据去均值,获得待分类图像集和训练图像集;模型共享的参数库随机初始化;计算待分类图像集和训练图像集的负梯度方向;训练基础卷积神经网络模型,训练基础卷积神经网络模型的权重;更新函数预测,得到加和模型;迭代达到最大训练次时,利用加和模型对待分类图像集进行识别。本发明使用深度卷积网络对特征进行层次化学习,利用梯度提升方法进行模型的聚合学习,用来克服单个模型容易陷入局部最优解问题,同时提高网络泛化能力;在模型训练过程中,加入了随机参数共享机制,提高模型的训练效率,可以在合理的时间代价下实现对特征的层次化学习,学习到的特征在场景识别中更具有鲁棒性。 | ||
搜索关键词: | 一种 基于 随机 卷积 神经网络 高分辨率 图像 场景 分类 方法 | ||
【主权项】:
一种基于随机卷积神经网络的高分辨率图像场景分类方法,其特征在于,包括以下步骤:步骤a,数据去均值,获得待分类图像集和训练图像集;步骤b,模型共享的参数库随机初始化;步骤c,计算步骤a中所得待分类图像集和训练图像集的负梯度方向,实现方式如下,设图像集x是输入数据,y是对应x的类别标签,N是数据个数,i是数据编号,首先令初始化输出函数f0(x)=0,k=1,...,K,t=1,其中f0(x)是非线性函数f(x)的初始函数,k是类别个数,共K个类别,t为迭代次数,计算优化函数Ψ(y,f(x))如下,pk(x)=exp(f(k)(x))/Σk=1Kexp(f(k)(x))---(1)]]>Ψ(y,f(x))=-Σk=1Kyklogpk(x)---(2)]]>其中f(k)(x)表示输出函数的第k个类别的输出值,pk(x)表示样本x属于第k个类别的概率,yk表示样本x是否为第k个类别,如果是则为1,不是则为0;然后利用优化函数计算负梯度方向如下,-gt(x)=-[∂Ψ(y,f(x))∂f(x)]f(x)=f^t-1(x)=y-p(x)---(3)]]>其中,表示第t‑1个f(x)的估计函数,p(x)表示样本x的各类别输出概率;第一次执行步骤c时,f(x)=f0(x);后续执行步骤c时,f(x)为上一次迭代得到的估计函数;步骤d,训练基础卷积神经网络模型,实现方式如下,首先从步骤b所得共享的参数库中随机选取一组卷积神经网络的参数组合θt,构成一个基础卷积神经网络模型h(x,θt),h(x,θt)=Σi=1N(12||h(x,θt)-gt(x)||2)+λΣl=1Lsum(||θ(l)||2)---(4)]]>其中θ(l)是第l个特征提取阶段的网络参数,设共L个特征提取阶段,l=1,2,…L,θ表示所有阶段的网络参数,θt是第t个非线性函数f(x)的网络参数θ,sum(.)指求和;然后基于步骤a所得的训练图像集,利用传统的反向误差传播算法和步骤c得到的负梯度方向,来最小化基础卷积神经网络模型h(x,θt)的误差,并对h(x,θt)进行训练,得到最优的参数组合θt,更新卷积神经网络参数并存入对应阶段参数库;步骤e,训练基础卷积神经网络模型的权重,实现方式如下,利用步骤d得到的基础卷积神经网络模型h(x,θt)和函数估计计算模型权重如下,ρt,k=argminρΣi=1NΣk=1KΨ(yk,f^t-1,k+ρt,khk(xi,θ))---(5)]]>其中,ρt,k是第t个非线性函数f(x)的第k类别权重,表示第t‑1个f(x)的估计函数,表示第k类别的hk(xi,θ)表示第i个数据xi第k类别的优化函数;权重更新为ρt,k=ρt‑1,k‑▽ρ,其中▽ρt,k=‑(1(c=k)·hc(x)‑pk(x)·hk(x)),▽ρ表示权值梯度,▽ρt,k表示第t次迭代第k类别的权值梯度,c代表某个样本的标签,指示函数1(c=k)表示如果c等于k则取值为1,否则为0,k=1,2,…K;hc(x)表示第c类别的基础卷积神经网络模型h(x,θt)输出值,hk(x)表示第k类别的基础卷积神经网络模型h(x,θt)输出值;步骤f,更新函数预测,得到加和模型,公式如下,f^t←f^t-1+λρth(x,θt)---(6)]]>其中,ρt是基础卷积神经网络的最佳梯度下降乘子,h(x,θt)为基础卷积神经网络模型,λ为缩放因子,且λ=1/(M+1);步骤g,判断迭代是否达到最大训练次数,若达到最大训练次数则转步骤h;否则令t=t+1,转步骤c,重新计算负梯度,并继续从共享的参数库中随机选取另一组参数组合,构成一个基础卷积神经网络模型,进行训练;步骤h,利用步骤f中所得的加和模型对步骤a所得的待分类图像集进行识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610628128.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于烟气浓度的火灾定位方法
- 下一篇:一种扫描图像识别的方法及装置