[发明专利]一种基于参考点的快速精确近邻分类算法在审

申请号：	201611173890.1	申请日：	2016-12-16
公开（公告）号：	CN106778869A	公开（公告）日：	2017-05-31
发明（设计）人：	夏书银	申请（专利权）人：	重庆邮电大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	北京同恒源知识产权代理有限公司11275	代理人：	廖曦
地址：	400065 ***	国省代码：	重庆;85
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于参考点的快速精确近邻分类算法，属于计算机技术领域。该算法用参考点的距离来替代样本点之间的距离的进行直接计算，找到了比最近邻样本更加适合分类的样本点，以提高算法的分类精度。本RPkN算法通过选择参考点和子序列长度来选择用于分类的近邻样本，而现有的k近邻算法总是查找最近邻样本来用于分类。RPkN通过计算样本点的RPF值避免了样本间距离的直接计算，将算法的时间复杂度降低到了(O(nlogn))，这种时间复杂度的降低不依赖任何维度的树结构，所以相比现有的精确的依赖树索引的k最近邻分类算法，其能够更好的适应高维数据集。
搜索关键词：	一种基于参考快速精确近邻分类算法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于参考点的快速精确近邻分类算法，其特征在于：该算法用参考点的距离来替代样本点之间的距离的进行直接计算，找到了比最近邻样本更加适合分类的样本点，以提高算法的分类精度，算法给定数据集D∈Rd，k是近邻算法中要搜索的近邻数，A是D中的一个样本点，ε为关系近邻搜索算法时间复杂度的常量；表示候选参考点设置为单位向量及其反向量，定义变量ExistingNeighbors＝NULL，j＝1，具体步骤包括：1)设置子序列的长度为2j*k*ε，并选择第i个候选参考点为当前的参考点；2)计算所有样本点的参考点因子值，即RPF值，并对所有样本点按照其RPF值进行排序并生成一个有序序列；3)在由ExistingNeighbors和以A为中心且长度为2j*k*ε的子序列构成的集合中，找到与到A最近的k的样本点；4)计算所有样本点的近邻样本及整个数据集的分类精度；5)i＝i+1，将第i个候选参考点设置为下一个参考点；并计算加入新参考点后的分类精度；6)如果所有候选参考点被加入且精度增加，用所有样本的k近邻样本替代ExistingNeighbors，转向步骤7)；如果还有候选参考点未被加入且精度增加，用所有样本的k近邻样本替代ExistingNeighbors，转向步骤5)；7)如果子序列长度增加后算法的分类精度降低，算法终止；否则，转向步骤8)；8)通过j＝j+1将子序列的长度增加1并转向步骤1)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于重庆邮电大学，未经重庆邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201611173890.1/，转载请声明来源钻瓜专利网。

上一篇：一种快速精确的粒球近邻分类算法
下一篇：一种基于RPCA技术的SAR图像舰船目标检测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于参考点的快速精确近邻分类算法在审

专利文献下载