摘要:k-近邻分类算法是机器学习分类算中一个重要的算法。其精度高具有广泛应用。但时间和空间复杂度高。本文着眼于此,根据香农熵理论,提出了一种通过计算信息增益寻找对分类结果影响最大的特征,并根据该特征进行原始训练集划分并进行样本裁剪构造训练子集,在该子集上应用传统k-近邻的方法,从而降低传统k-近邻分类算法的时间复杂度。实验结果表明,该方法保持了传统k-近邻分类算法的精度,引入了最重要特征对分类结果的影响,有效降低了传统k-近邻分类算法的时间复杂度。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社