[发明专利]一种基于随机卷积神经网络的高分辨率图像场景分类方法在审

专利信息
申请号: 201610628128.1 申请日: 2016-08-03
公开(公告)号: CN106250931A 公开(公告)日: 2016-12-21
发明(设计)人: 杜博;张帆;张良培 申请(专利权)人: 武汉大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 武汉科皓知识产权代理事务所(特殊普通合伙)42222 代理人: 严彦
地址: 430072 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于随机卷积神经网络的高分辨率图像场景分类方法,包括数据去均值,获得待分类图像集和训练图像集;模型共享的参数库随机初始化;计算待分类图像集和训练图像集的负梯度方向;训练基础卷积神经网络模型,训练基础卷积神经网络模型的权重;更新函数预测,得到加和模型;迭代达到最大训练次时,利用加和模型对待分类图像集进行识别。本发明使用深度卷积网络对特征进行层次化学习,利用梯度提升方法进行模型的聚合学习,用来克服单个模型容易陷入局部最优解问题,同时提高网络泛化能力;在模型训练过程中,加入了随机参数共享机制,提高模型的训练效率,可以在合理的时间代价下实现对特征的层次化学习,学习到的特征在场景识别中更具有鲁棒性。
搜索关键词: 一种 基于 随机 卷积 神经网络 高分辨率 图像 场景 分类 方法
【主权项】:
一种基于随机卷积神经网络的高分辨率图像场景分类方法,其特征在于,包括以下步骤:步骤a,数据去均值,获得待分类图像集和训练图像集;步骤b,模型共享的参数库随机初始化;步骤c,计算步骤a中所得待分类图像集和训练图像集的负梯度方向,实现方式如下,设图像集x是输入数据,y是对应x的类别标签,N是数据个数,i是数据编号,首先令初始化输出函数f0(x)=0,k=1,...,K,t=1,其中f0(x)是非线性函数f(x)的初始函数,k是类别个数,共K个类别,t为迭代次数,计算优化函数Ψ(y,f(x))如下,pk(x)=exp(f(k)(x))/Σk=1Kexp(f(k)(x))---(1)]]>Ψ(y,f(x))=-Σk=1Kyklogpk(x)---(2)]]>其中f(k)(x)表示输出函数的第k个类别的输出值,pk(x)表示样本x属于第k个类别的概率,yk表示样本x是否为第k个类别,如果是则为1,不是则为0;然后利用优化函数计算负梯度方向如下,-gt(x)=-[∂Ψ(y,f(x))∂f(x)]f(x)=f^t-1(x)=y-p(x)---(3)]]>其中,表示第t‑1个f(x)的估计函数,p(x)表示样本x的各类别输出概率;第一次执行步骤c时,f(x)=f0(x);后续执行步骤c时,f(x)为上一次迭代得到的估计函数;步骤d,训练基础卷积神经网络模型,实现方式如下,首先从步骤b所得共享的参数库中随机选取一组卷积神经网络的参数组合θt,构成一个基础卷积神经网络模型h(x,θt),h(x,θt)=Σi=1N(12||h(x,θt)-gt(x)||2)+λΣl=1Lsum(||θ(l)||2)---(4)]]>其中θ(l)是第l个特征提取阶段的网络参数,设共L个特征提取阶段,l=1,2,…L,θ表示所有阶段的网络参数,θt是第t个非线性函数f(x)的网络参数θ,sum(.)指求和;然后基于步骤a所得的训练图像集,利用传统的反向误差传播算法和步骤c得到的负梯度方向,来最小化基础卷积神经网络模型h(x,θt)的误差,并对h(x,θt)进行训练,得到最优的参数组合θt,更新卷积神经网络参数并存入对应阶段参数库;步骤e,训练基础卷积神经网络模型的权重,实现方式如下,利用步骤d得到的基础卷积神经网络模型h(x,θt)和函数估计计算模型权重如下,ρt,k=argminρΣi=1NΣk=1KΨ(yk,f^t-1,k+ρt,khk(xi,θ))---(5)]]>其中,ρt,k是第t个非线性函数f(x)的第k类别权重,表示第t‑1个f(x)的估计函数,表示第k类别的hk(xi,θ)表示第i个数据xi第k类别的优化函数;权重更新为ρt,k=ρt‑1,k‑▽ρ,其中▽ρt,k=‑(1(c=k)·hc(x)‑pk(x)·hk(x)),▽ρ表示权值梯度,▽ρt,k表示第t次迭代第k类别的权值梯度,c代表某个样本的标签,指示函数1(c=k)表示如果c等于k则取值为1,否则为0,k=1,2,…K;hc(x)表示第c类别的基础卷积神经网络模型h(x,θt)输出值,hk(x)表示第k类别的基础卷积神经网络模型h(x,θt)输出值;步骤f,更新函数预测,得到加和模型,公式如下,f^t←f^t-1+λρth(x,θt)---(6)]]>其中,ρt是基础卷积神经网络的最佳梯度下降乘子,h(x,θt)为基础卷积神经网络模型,λ为缩放因子,且λ=1/(M+1);步骤g,判断迭代是否达到最大训练次数,若达到最大训练次数则转步骤h;否则令t=t+1,转步骤c,重新计算负梯度,并继续从共享的参数库中随机选取另一组参数组合,构成一个基础卷积神经网络模型,进行训练;步骤h,利用步骤f中所得的加和模型对步骤a所得的待分类图像集进行识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610628128.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top