摘要:为提高随机森林算法在基因表达数据分类方面的性能,提出基于局部保持映射的随机森林算法。对每棵决策树的所有节点,通过局部保持映射,将节点数据映射到新的属性空间中,选取第一个属性为最佳分裂属性。与传统随机森林算法相比,该算法缩短了决策树的构建时间,增加了决策树之间的差异性,明显提高了分类准确率。在9个标准基因表达数据集的对比实验结果表明,该算法性能优于传统随机森林算法,对基因表达数据中类不平衡导致正类样本准确率低的问题有一定改善。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
相关期刊
相关论文
期刊名称:计算机工程与设计
期刊级别:北大期刊
期刊人气:3782