基于最重要特征的裁剪k-近邻分类算法设计

作者:赵琳; 行致源

摘要:k-近邻分类算法是机器学习分类算中一个重要的算法。其精度高具有广泛应用。但时间和空间复杂度高。本文着眼于此,根据香农熵理论,提出了一种通过计算信息增益寻找对分类结果影响最大的特征,并根据该特征进行原始训练集划分并进行样本裁剪构造训练子集,在该子集上应用传统k-近邻的方法,从而降低传统k-近邻分类算法的时间复杂度。实验结果表明,该方法保持了传统k-近邻分类算法的精度,引入了最重要特征对分类结果的影响,有效降低了传统k-近邻分类算法的时间复杂度。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 工程科技II
  • >
  • 电力工业
收录:
  • 知网收录(中)
  • 万方收录(中)
  • 上海图书馆馆藏
  • 维普收录(中)
  • 国家图书馆馆藏
  • 统计源期刊(中国科技论文优秀期刊)
关键词:
  • 香农熵
  • 分类
  • 划分

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:电子设计工程

期刊级别:统计源期刊

期刊人气:14245

杂志介绍:
主管单位:陕西省科学技术协会
主办单位:陕西科技报社
出版地方:陕西
快捷分类:机械
国际刊号:1674-6236
国内刊号:61-1477/TN
邮发代号:5-142
创刊时间:1994
发行周期:半月刊
期刊开本:A4
下单时间:1-3个月
复合影响因子:0.91
综合影响因子:1.1