基于E-t-SNE的混合属性数据降维可视化方法

作者:魏世超; 李歆; 张宜弛; 周晓锋; 李帅

摘要:针对传统的t分布随机近邻嵌入(t-SNE)算法只能处理单一属型数据,不能很好地处理混合属性数据的问题,提出一种扩展的t-SNE降维可视化算法E-t-SNE,用于处理混合属性数据。该方法引入信息熵概念来构建分类属性数据的距离矩阵,采用分类属性数据距离与数值属性数据欧式距离相结合的方式构建混合属性数据距离矩阵,将新的距离矩阵输入t-SNE算法对数据进行降维并在二维空间可视化展示。此外,为验证算法有效性,采用k近邻(kNN)算法对混合数据降维后的效果进行评价。通过在UCI数据集上的实验表明,该方法在处理混合属性数据方面,不仅具有较好的可视化能力,而且能有效地对不同类别的数据进行降维分簇,提升后续分类器的分类准确率。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 信息科技
  • >
  • 电子信息科学综合
收录:
  • 知网收录(中)
  • 北大期刊(中国人文社会科学期刊)
  • CSCD 中国科学引文数据库来源期刊(含扩展版)
  • JST 日本科学技术振兴机构数据库(日)
  • 剑桥科学文摘
  • Pж(AJ) 文摘杂志(俄)
  • 上海图书馆馆藏
  • SA 科学文摘(英)
  • 万方收录(中)
  • 哥白尼索引(波兰)
  • 国家图书馆馆藏
  • 维普收录(中)
  • 统计源期刊(中国科技论文优秀期刊)
关键词:
  • 混合属性数据
  • 降维
  • 可视化

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:计算机工程与应用

期刊级别:北大期刊

期刊人气:5351

杂志介绍:
主管单位:中国电子科技集团公司
主办单位:华北计算技术研究所
出版地方:北京
快捷分类:计算机
国际刊号:1002-8331
国内刊号:11-2127/TP
邮发代号:82-605
创刊时间:1964
发行周期:半月刊
期刊开本:A4
下单时间:1-3个月
复合影响因子:0.68
综合影响因子:2.11