使用EBIC的软件故障特征选择方法

作者:涂吉屏; 钱晔; 王炜; 范道远; 张涵宇

摘要:软件故障预测中若采用大量度量指标建立预测模型,可能因其中含有无关特征使预测模型性能受到不良影响,故障预测中的特征选择步骤选取一定维度的部分故障数据建立预测模型来提高模型性能,以达到压缩特征维度,提高模型预测精度,降低预测模型复杂度,节约计算资源的目的。传统特征排序方法仅评估单个特征对类标的影响,建立的预测模型有效性较低;特征子集选择方法需搜索所有特征子集,耗费计算资源且所选特征维数较高。针对以上问题,提出一种基于拓展贝叶斯信息准则的特征选择方法(EBIC-FS),该方法对数据进行线性回归,并计算出残差平方和较小且数据维数较少的特征模型。在公开数据集M&R及Promise上进行实验,结果表明该方法能有效压缩特征维度,且预测模型性能与5种基线方法相比有较大提升。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 信息科技
  • >
  • 电子信息科学综合
收录:
  • CSCD 中国科学引文数据库来源期刊(含扩展版)
  • Pж(AJ) 文摘杂志(俄)
  • 知网收录(中)
  • 哥白尼索引(波兰)
  • 万方收录(中)
  • 剑桥科学文摘
  • 国家图书馆馆藏
  • 维普收录(中)
  • 北大期刊(中国人文社会科学期刊)
  • 上海图书馆馆藏
  • 统计源期刊(中国科技论文优秀期刊)
关键词:
  • 软件故障预测
  • 特征选择
  • 拓展贝叶斯信息准则
  • 最佳特征子集

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:计算机科学与探索

期刊级别:北大期刊

期刊人气:4095

杂志介绍:
主管单位:中国电子科技集团公司
主办单位:华北计算技术研究所
出版地方:北京
快捷分类:计算机
国际刊号:1673-9418
国内刊号:11-5602/TP
邮发代号:82-560
创刊时间:2007
发行周期:月刊
期刊开本:A4
下单时间:1-3个月
复合影响因子:0.65
综合影响因子:1.52