DBN在蛋白质编码区识别问题中的应用研究

作者:胡青渝; 刘广臣

摘要:针对真核生物DNA序列中蛋白质编码区的识别问题,提出基于深度置信网络(Deep Belief Network,DBN)的组合模型。通过信号处理技术对真核生物的DNA序列进行数值转换,并结合统计学知识提取转换后DNA序列的数值特征;利用随机森林对所提取的特征变量降维;用深度置信网络模型对DNA序列分类判别;根据短时傅里叶变换(Short Time Fourier Transform,STFT)技术对外显子区准确定位。在三个标准测试集上比较组合模型与传统Logistic回归模型、贝叶斯判别模型的判别效果,结果显示,深度置信网络组合模型的准确率和特异度等指标都明显优于Logistic回归模型和贝叶斯判别模型。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 信息科技
  • >
  • 电子信息科学综合
收录:
  • 知网收录(中)
  • 北大期刊(中国人文社会科学期刊)
  • CSCD 中国科学引文数据库来源期刊(含扩展版)
  • JST 日本科学技术振兴机构数据库(日)
  • 剑桥科学文摘
  • Pж(AJ) 文摘杂志(俄)
  • 上海图书馆馆藏
  • SA 科学文摘(英)
  • 万方收录(中)
  • 哥白尼索引(波兰)
  • 国家图书馆馆藏
  • 维普收录(中)
  • 统计源期刊(中国科技论文优秀期刊)
关键词:
  • 编码区识别
  • 信号处理
  • 随机森林

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:计算机工程与应用

期刊级别:北大期刊

期刊人气:5347

杂志介绍:
主管单位:中国电子科技集团公司
主办单位:华北计算技术研究所
出版地方:北京
快捷分类:计算机
国际刊号:1002-8331
国内刊号:11-2127/TP
邮发代号:82-605
创刊时间:1964
发行周期:半月刊
期刊开本:A4
下单时间:1-3个月
复合影响因子:0.68
综合影响因子:2.11