一种基于模糊C均值聚类的稀疏数据缺失值填充方法

作者:张楷卉; 李鹏

摘要:缺失数据处理通常基于统计学的方法,在数据预处理阶段对缺失值进行填补,其效率和准确性并不高。因此,提出了一种基于模糊C均值(FCM)聚类的嵌入式填充方法(FCMSI)。此算法通过平均比率法(ARM)对稀疏数据进行初始化填充;采用局部距离策略对FCM进行改进,并对数据进行聚类;将缺失数据作为变量,在每次聚类迭代后的簇内采用协同过滤(CF)的思想对变量值进行替换,直到结果收敛。利用UCI标准数据集进行对比实验,并采用三种不同评价指标衡量,验证了FCMSI方法比传统填充方法性能显著提高。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 基础科学
  • >
  • 自然科学理论与方法
收录:
  • 上海图书馆馆藏
  • CA 化学文摘(美)
  • 万方收录(中)
  • JST 日本科学技术振兴机构数据库(日)
  • 维普收录(中)
  • 知网收录(中)
  • 国家图书馆馆藏
  • 统计源期刊(中国科技论文优秀期刊)
  • 文摘杂志
  • 数学文摘
  • 剑桥科学文摘
关键词:
  • 缺失数据填充
  • 稀疏数据
  • 模糊c均值聚类
  • 协同过滤

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:黑龙江大学自然科学学报

期刊级别:统计源期刊

期刊人气:947

杂志介绍:
主管单位:黑龙江省教育厅
主办单位:黑龙江大学
出版地方:黑龙江
快捷分类:科学
国际刊号:1001-7011
国内刊号:23-1181/N
邮发代号:
创刊时间:1978
发行周期:双月刊
期刊开本:A4
下单时间:1-3个月
复合影响因子:0.39
综合影响因子:0.44