[发明专利]一种基于最近邻KNN算法的缺失数据填补方法有效
申请号: | 201710267672.2 | 申请日: | 2017-04-21 |
公开(公告)号: | CN107193876B | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 程宏亮;刘宏;白朝旭;饶思维;张建 | 申请(专利权)人: | 美林数据技术股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/23 |
代理公司: | 西安毅联专利代理有限公司 61225 | 代理人: | 杨燕珠 |
地址: | 710000 陕西省西安市高*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于最近邻KNN算法的缺失数据填补方法,包括:自动识别数据集中的存在缺失值的特征属性;遍历存在缺失值的特征属性利用近邻KNN算法逐步填充缺失值;在对每一个特征属性进行缺失值填充过程中,迭代KNN算法参数k,获得不同参数配置的KNN模型簇;根据优化目标函数遴选最优模型,并利用该模型对缺失数据进行缺失值填充。由于算法参数k对KNN算法影响较大,在此,我们采用寻优的策略运用到缺失值填充模型的建模中,可以很大程度提高模型的精度,填充数据的质量相应有了很大程度的提高。 | ||
搜索关键词: | 一种 基于 近邻 knn 算法 缺失 数据 填补 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美林数据技术股份有限公司,未经美林数据技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710267672.2/,转载请声明来源钻瓜专利网。