摘要:针对大数据的数据量大、维数高的特征,论文提出了一种新型的分布式离群点检测算法-VDOD。在数据预处理阶段,提出了基于方差的数据划分方法,划分过程中建立KD树,通过KD树将数据均匀地分配到各个计算节点;在离群点检测阶段,通过R树进行批量过滤。最后,基于真实数据集和人工数据集验证了VDOD算法的有效性。实验结果表明,相对于现有算法,文中算法可以显著提高计算效率并大幅降低网络开销。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
期刊名称:计算机与数字工程
期刊级别:统计源期刊
期刊人气:8474