[发明专利]一种基于大间隔分布学习的数字媒体对象分类方法有效
申请号: | 201410326282.4 | 申请日: | 2014-07-09 |
公开(公告)号: | CN104102705B | 公开(公告)日: | 2018-11-09 |
发明(设计)人: | 周志华;张腾 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于大间隔分布学习的数字媒体对象分类方法,为了克服数字媒体对象类别标记的噪声问题,通过最大化间隔均值同时最小化间隔方差,最终将数字媒体对象的分类问题形式化成一个凸二次优化问题,并根据是否使用非线性核函数以及训练数字媒体对象库本身的特征,给出了分别基于对偶坐标下降和基于平均随机梯度下降两种寻优算法的实现,用户可根据实际情况自行选择。若用户选择非线性核函数,则训练时选择DCD作为寻优算法;若用户选择线性核函数,且训练数字媒体对象库样本很多或特征很稀疏,则训练时选择ASGD作为寻优算法,否则依然选择DCD作为寻优算法。 | ||
搜索关键词: | 数字媒体对象 算法 寻优 非线性核 大间隔 二次优化问题 线性核函数 最小化间隔 分类问题 类别标记 随机梯度 噪声问题 最大化 分类 对偶 方差 稀疏 样本 学习 | ||
【主权项】:
1.一种基于大间隔分布学习的数字媒体对象分类方法,其特征在于:首先,先建立好一个包含数字媒体对象信息数字媒体对象库作为训练数据,所述数字媒体对象库中的每一个数字媒体对象都带有类别标记;接着,将训练数字媒体对象转换成特征表示,具体来说,将训练数字媒体对象输入到特征提取算法中,得到数字媒体对象的特征向量;然后,将所有训练数字媒体对象对应的特征向量及其类别标记都输入进分类模型的训练算法,训练完之后得到分类模型;在预测阶段,用户将待预测的数字媒体对象输入分类模型,分类模型即可输出其预测的类别标记;在训练分类模型时,通过最大化间隔均值同时最小化间隔方差,最终将数字媒体对象的分类问题形式化成一个凸二次优化问题,并根据是否使用非线性核函数以及训练数字媒体对象库本身的特征,给出了分别基于对偶坐标下降和基于平均随机梯度下降两种寻优算法的实现,用户可根据实际情况自行选择;若用户选择非线性核函数,则训练时选择DCD作为寻优算法;若用户选择线性核函数,且训练数字媒体对象库样本很多或特征很稀疏,则训练时选择ASGD作为寻优算法,否则依然选择DCD作为寻优算法;DCD为基于对偶坐标下降,ASGD为基于平均随机梯度下降。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410326282.4/,转载请声明来源钻瓜专利网。