利用聚类分析和离群点检测的数据填补方法

作者:马永军; 汪睿; 李亚军; 陈海山

摘要:为提高数据填补方法的正确率,提出利用核K-Means聚类和离群点检测来填补缺失数据的算法(KKMOD)。用核方法将数据集映射到高维空间,聚类后形成不同簇,在同簇内选择与缺失数据最相似的数据进行填补,使用核K-Means进行离群点检测,将检测到的离群点去除填补值,重新放入数据集填补,算法不断迭代,直到填补的数据不再检测出离群点。实验结果表明,KKMOD方法能够充分考虑簇内关系,避免不同簇相互干扰,提高数据填补算法的正确率。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 信息科技
  • >
  • 电子信息科学综合
收录:
  • 北大期刊(中国人文社会科学期刊)
  • 统计源期刊(中国科技论文优秀期刊)
  • 知网收录(中)
  • 维普收录(中)
  • 万方收录(中)
  • SA 科学文摘(英)
  • JST 日本科学技术振兴机构数据库(日)
  • Pж(AJ) 文摘杂志(俄)
  • 哥白尼索引(波兰)
  • 国家图书馆馆藏
  • 上海图书馆馆藏
关键词:
  • 核方法
  • 聚类分析
  • 缺失数据
  • 数据填补
  • 离群点检测

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:计算机工程与设计

期刊级别:北大期刊

期刊人气:3782

杂志介绍:
主管单位:中国航天科工集团
主办单位:中国航天科工集团第二研究院706所
出版地方:北京
快捷分类:计算机
国际刊号:1000-7024
国内刊号:11-1775/TP
邮发代号:82-425
创刊时间:1980
发行周期:月刊
期刊开本:A4
下单时间:1-3个月
复合影响因子:0.62
综合影响因子:1.32