生物信息学杂志

发表咨询:400-808-1731

订阅咨询:400-808-1751

生物信息学杂志 统计源期刊

China Journal of Bioinformatics

  • 23-1513/Q 国内刊号
  • 1672-5565 国际刊号
  • 0.94 影响因子
  • 1个月内下单 审稿周期
生物信息学是哈尔滨工业大学主办的一本学术期刊,主要刊载该领域内的原创性研究论文、综述和评论等。杂志于2003年创刊,目前已被维普收录(中)、知网收录(中)等知名数据库收录,是中华人民共和国工业和信息化部主管的国家重点学术期刊之一。生物信息学在学术界享有很高的声誉和影响力,该期刊发表的文章具有较高的学术水平和实践价值,为读者提供更多的实践案例和行业信息,得到了广大读者的广泛关注和引用。
栏目设置:综述、研究论文

生物信息学 2009年第02期杂志 文档列表

杨树木质素合成酶CCR基因的序列分析及蛋白结构预测81-84

摘要:利用RT—PCR从欧美杨107次生木质部中克隆出-961bp的CCR基因片段。通过生物信息学软件对该序列的核苷酸序列、拟翻译的氨基酸序列的疏水性、残基带电量及表面暴露区、蛋白质二级结构、亚细胞定位及三维结构等进行了初步分析预测。结果表明该CCR基因含一个编码301个氨基酸的完整开放阅读框,其成熟蛋白为亲水性的、主要存在于细胞膜,具有大多数植物CCR蛋白普遍存在的KNWYCYGK的保守性基序,其二级结构中共包含12个α螺旋,20个β折叠,11个卷曲,并构建了其三维结构图。

基于模拟退火算法的高分辨率蛋白质质谱数据特征选择85-90

摘要:蛋白质质谱技术是蛋白质组学的重要研究工具,它被出色地应用于癌症早期诊断等领域,但是蛋白质质谱数据带来的维灾难问题使得降维成为质谱分析的必需的步骤。本文首先将美国国家癌症研究所提供的高分辨率SELDI—TOF卵巢质谱数据进行预处理;然后将质谱数据的特征选择问题转化成基于模拟退火算法的组合优化模型,用基于线性判别式分析的分类错误率和样本后验概率构造待优化目标函数,用基于均匀分布和控制参数的方法构造新解产生器,在退火过程中添加记忆功能;然后用10-fold交叉验证法选择训练和测试样本,用线性判别式分析分类器评价降维后的质谱数据。实验证明,用模拟退火算法选择6个以上特征时,能够将高分辨率SELDI—TOF卵巢质谱数据全部正确分类,说明模拟退火算法可以很好地应用于蛋白质质谱数据的特征选择。

基于模糊理论预测CpG岛新方法91-94

摘要:启动子区域的CpG岛的异常甲基化是识别癌症的重要标志之一。目前已经建立的一些CpG岛的预测思想和方法都有自身的缺点,基于模糊理论的预测思想从贴进度的角度来判定CpG岛,能更容易地找到被以往方法所忽略的具有更多生物学意义的CpG岛。本研究通过构建属于CpG岛集合的隶属函数,计算候选序列的隶属度,找出所有的可接受隶属程度的CpG岛。将该方法应用于UCSC数据库中的一段序列(hg18.chr1.31618510.31623510.-1000)进行预测,发现提高了预测的精确度。可见应用模糊理论预测CpG岛具有一定的可行性,利用选取不同的截集,可以得到更为精确的CpG岛。

基于信息论k—modes聚类法的基因表达数据分析95-98

摘要:k-均值聚类算法是一种广泛应用于基因表达数据聚类分析中的迭代变换算法,它通常用距离法来表示基因间的关系,但不能有效的反应基因间的相互依赖的关系。为此,提出基于信息论的k-modes聚类算法,克服了以上缺点。另外,还引入了伪F统计量,一方面,可以对空间中有部分重叠的点进行有效的分类;另一方面,可以给出最佳聚类数目,从而弥补了k-modes聚类法的不足。使其成为一种非常有效的算法,从而达到较优的聚类效果。

基因芯片整合方法在预报儿童急性髓性白血病亚型中的应用99-103

摘要:对急性髓性白血病(AML)病人进行明确的亚型分类,有助于制定合适的治疗方案并预测其治疗效果。之前研究表明基因芯片技术在白血病亚型分类中已取得了较好效果,但由于儿童AML发病率较低,相应的芯片分析研究较少,因此目前用于构建儿童AML亚型分类模型的数据相对不足,是否可以应用现有的成人分类模型数据来对儿童AML进行预报还有待研究。应用基因芯片整合分析方法,对来自不同实验的研究成人或儿童AML亚型分类的基因芯片数据进行整合,应用支持向量机分析整合后数据集的亚型预报准确率。结果表明整合后的芯片数据在儿童AML亚型分类预报中的准确率达到97.24%,特征基因分析结果也说明在同一种AML亚型中,对于来自不同年龄组的样本,其特征基因有较高的表达相似性。

靶向树突状细胞表面分子DEC-205长循环免疫脂质体稳定性模型的构建及其生物学特性104-107

摘要:应用多相分散体系的动力稳定性和聚结稳定性理论,以薄膜分散法构建了靶向树突状细胞(dendritic cells,DCs)表面分子DEC-205长循环免疫脂质体(anti—DEC-205 iLPSM)的稳定性模型,并对其物理稳定性、生物学特性等进行了考察。结果表明经优化后的脂质体4℃贮存7d后粒径分布变化较小;FTTC-dextran累积泄漏率小于7%;耦联抗DEC-205的免疫脂质体(anti—DEC-205 iLPSM)可特异性地识别DCs,并作为良好载体将FITC-dextran带入DCs浆内。anti—DEC-205 iLPSM模型的构建为进一步研究抗原靶向DEC-205受体后的体内免疫应答情况提供了工作基础,有望开发一种新型DCs疫苗应用于临床。

水稻水溶性环氧化合物水解酶的生物信息学分析108-112

摘要:水溶性环氧化合物水解酶(Soluble Epoxide Hydrolase,SEH)是一组催化环氧化合物水解为相应邻位二醇的酶类,在哺乳动物、植物、昆虫和微生物体内广泛存在。通过BLAST对水稻基因组的蛋白质数据库进行搜索,获得10个水溶性环氧化物水解酶(Soluble Epoxide Hydrolase SEH)sEH蛋白的同源序列。经分析发现这些基因在水稻不同胁迫处理下各个部位都有所表达,而且不同成员之间的表达模式存在较大的差异。水稻sEH蛋白主要参与角质层形成,应激反应,以及病原防御等生理过程,特别在脱毒过程中扮演着重要的角色。对蛋白质多序列联配和三级结构预测结果表明:水溶性环氧化合物水解酶的核心结构域由3个催化残基Asp、His和Asp形成三位一体的催化活性构象。这类基因的表达受抗逆环境诱导,其功能与抗逆性有关,为基因工程抗逆育种提供了参考。

生物信息学在植物miRNA研究中的应用113-116

摘要:植物miRNA的研究已经从小规模实验向大规模计算分析方向发展,生物信息学的应用成为当前植物miRNA研究的热点问题。本文回顾了最近几年生物信息学在植物miRNA研究中取得的最新进展,简要介绍了植物miRNA的形成及其作用方式,重点对植物miRNA的计算识别、靶基因预测、启动子分析方法进行了讨论,并对相关的数据库资源进行了总结,最后展望了该领域研究的发展方向,将为植物miRNA的计算研究提供理论指导。

利用支持向量机和马氏判别式预测人类polⅡ启动子117-119

摘要:通过选取人类启动子与非启动子序列中不同的k-mer作为预测算法的基础特征,分别以三个区域(-249~-1;0~+50;-30~+30)的6-mer频数作为离散源参数构建离散增量,同时选取24个位点(-31~-21;-4-+2;+25-+29)的3-mer频数作为位置打分函数的参数,分别利用支持向量机和马氏判别式为判别函数对启动子进行预测。用10折叠交叉检验来衡量两种算法的预测能力,预测结果成功率分别达到87.0%和87.9%。对于独立检验集,敏感性分别为62.7%和76.0%,特异性分别为77.5%和66.8%。

细胞代谢复杂网络研究进展120-124

摘要:复杂网络理论为细胞代谢网络研究提供了新的工具,基于复杂网络理论的细胞代谢网络研究可称细胞代谢复杂网络研究.先简要介绍了细胞代谢复杂网络的研究背景;随后详细总结和论述了细胞代谢复杂网络在建模、分析和控制三个方面的研究现状;再进一步指出了细胞代谢复杂网络在建模、分析和控制这三个方面研究中所存在的一些问题.为细胞代谢复杂网络领域的研究指出了一些有意义的方向,具有一定的参考价值。

非专业研究生生物信息学课程教学中存在的问题及对策125-127

摘要:生物信息学是一门多学科交叉的核心学科,对生物医学研究和发展有着巨大的推动作用。对非专业研究生生物信息学课程教学进行剖析,阐述了生物信息学课程的适用对象,总结了教学中存在的供需矛盾及课程教学中存在的问题,并提出了相应对策,为进一步提高非专业研究生生物信息学课程教学质量提供参考。

基于结构信息的RNA多序列比对128-132

摘要:多序列比对是生物信息学中重要的基础研究内容,对各种RNA序列分析方法而言,这也是非常重要的一步。不像DNA和蛋白质,许多功能RNA分子的序列保守性要远差于其结构的保守性,因此,对RNA的分析研究要求其多序列比对不仅要考虑序列信息,而且要充分考虑到其结构信息。本文提出了一种考虑了结构信息的同源RNA多序列比对算法,它先利用热力学方法计算出每条序列的配对概率矩阵,得到结构信息,由此构造各条序列的结构信息矢量,结合传统序列比对方法,提出优化目标函数,采用动态规划算法和渐进比对得到最后的多序列比对。试验证实该方法的有效性。

蛋白质特征曲线的研究133-136

摘要:提出一种新颖的方案使蛋白质结构信息可视化。在滑动窗口方法基础上,每一个天然氨基酸采用从氨基酸索引数据库中挑选的48种特性参数描述,在某一特定窗口下的所有氨基酸残基的参数就组成一个矩阵,通过矩阵变换得到一个方矩阵,再经过窗口的滑动就得到基于整个蛋白质的所有这些窗口矩阵的本征值矩阵。对本征值矩阵元素作图得到一系列的本征值曲线,这种曲线的轮廓不随窗口的变化而变化,这些曲线被称为蛋白质的特征曲线。为选择合适的窗口宽度、对同一类型蛋白质不同窗口宽度及不同类型蛋白质相同窗口宽度下的本征值矩阵进行了比较研究,对其潜在的用途进行了讨论。

美洲大蠊新基因Parcxpwxxq01的分析及功能预测137-139

摘要:为进一步研究已发现的美洲大蠊新基因Parcxpwxxq01,我们采用BLASTp,ORF Finder,ProtScale,ScanProsite和Tmpred Server等软件或数据库进行相似性比较、开放读码框预测和编码蛋白质的功能等生物信息学方法对该序列进行特征分析和功能预测,以获得该基因及其编码的蛋白质的更多功能提示。结果发现得到的Parcxpwxxq01序列是该基因的全长序列,该基因编码的蛋白质是一碱性跨膜蛋白,该蛋白质可能为美洲大蠊的药用有效成分,有进一步研究的价值。

基于神经网络数据挖掘的红色籽用西瓜亲本选择方法研究140-142

摘要:根据多年来红色籽用西瓜自交系育种过程中,积累的多代性状复杂、数量庞大的种质资源及数据,利用数据挖掘中的反向传播(Back propagation,BP)神经网络方法,建立红色籽用西瓜BP神经网络模型。以红籽瓜数量性状作为预测依据,选择出具有丰产性状的红籽瓜亲本材料,为育种工作者进行亲本选择时提供一种新的途径和方法。

基于Web的基因组序列数据库管理系统的设计与实现143-145

摘要:设计一种基于网络的可用来存储和注释海量DNA数据的数据库模型。整个过程分为三部分:首先是构建数据库框架,然后对原始基因组序列数据进行批量注释并输出有效格式导入数据库,最后通过一个友好的用户交互界面,实现对基因组数据的在线读取,查询,注释等操作。设计的数据库用于解决大量产生并有待分析的基因组序列的有效存储和管理问题。

基于医学信息数据仓库模型的数据挖掘146-149

摘要:利用数据仓库和数据挖掘技术,以现有医院信息系统HIS及医学信息资源为基础,基于PC和Windows操作系统,利用SQL Server2005及SQL Server 2005 Analysis Services(SSAS)等软件,搭建了医学信息数据仓库模型,并运用数据挖掘技术抽取数据库中数据隐藏的规律,提高医学信息的利用率。为从错综复杂的、庞大的医学信息库中提取有价值的决策支持信息提供有效的途径和方法。

密码对的偏爱与基因组进化的相关性分析150-154

摘要:以5种真核、15种细菌、10种古菌生物基因组为样本,对密码对使用偏好性指标Г与密码对随基因组进化的指标α之间作线性分析,发现部分密码对的r值与α之间有显著的线性关系;密码子第三位点与紧邻密码子第一位点的双碱基(cP3cAl)使用与基因组进化有关。结果进一步肯定了密码对的使用与基因组进化存在相关性,同时从密码对使用的角度揭示了真核生物、真细菌、古菌的基本差别。