生物信息学杂志

发表咨询:400-808-1731

订阅咨询:400-808-1751

生物信息学杂志 统计源期刊

China Journal of Bioinformatics

  • 23-1513/Q 国内刊号
  • 1672-5565 国际刊号
  • 0.94 影响因子
  • 1个月内下单 审稿周期
生物信息学是哈尔滨工业大学主办的一本学术期刊,主要刊载该领域内的原创性研究论文、综述和评论等。杂志于2003年创刊,目前已被维普收录(中)、知网收录(中)等知名数据库收录,是中华人民共和国工业和信息化部主管的国家重点学术期刊之一。生物信息学在学术界享有很高的声誉和影响力,该期刊发表的文章具有较高的学术水平和实践价值,为读者提供更多的实践案例和行业信息,得到了广大读者的广泛关注和引用。
栏目设置:综述、研究论文

生物信息学 2011年第01期杂志 文档列表

用于生理组学协同研究的跨层次建模标记语言(M3L)-

摘要:根据生理组学多领域多层次协同研究的需求,针对中国生理组学研究的特点,设计了一种跨层次建模标记语言(Mul-tiscale Modeling Markup Language,简称M3L),规范研究过程中的信息描述方法,实现了数学模型和计算数据的开放式共享和重用。M3L包含结构化模型机制、数据存档机制、信息交互与重用机制、数学描述机制、可视化模型及附件描述机制。M3L中针对人体和小动物解剖结构数据的特殊设计实现了结构与功能信息的关联,促进了中国生理组学研究中模型和数据的标准化描述;M3L以跨层次结构化的方式描述模型,符合生理组学研究模型的特点,满足了协同开发的需求。

蛋白质结构从头预测方法研究进展1-5

摘要:蛋白质结构从头预测是不依赖模板仅从氨基酸序列信息得到天然结构。它的关键是正确定义能量函数、精确选用计算机搜索算法来寻找能量最低值。基于此,本文系统介绍了能量函数和构象搜索策略,并列举了几种比较成功的从头预测方法,通过比较得出结论:基于统计学知识的能量函数是近年来从头预测发展的主要方向,现有从头预测的构象搜索都用到Monte Carlo法。这表明随着蛋白质结构预测研究的深入,能量函数的构建、构象搜索方法的选择、大分子蛋白质结构的从头预测等关键性问题都取得了突破性进展。

人类Y染色体回文序列紧邻核苷酸的语言特征6-9

摘要:人类基因组Y染色体回文序列具有非常特殊的对称结构,容纳了许多控制着睾丸发育的基因,破译其结构与所隐含的遗传信息成为生物信息学家们的机遇和挑战.利用语言学中Zipf定律的方法分析了Y染色体八个回文序列(P1~P8)中紧邻核苷酸的频率及其关联度的分布特征。用数学模型进行了精确地描述,发现紧邻核苷酸的频率分布并不满足Zipf定律,而满足三次多项式分布及紧邻核苷酸关联度的分布,满足逆函数分布,这些特征是人类Y染色体回文序列长期进化的结果。

奶牛CRP基因SNP的生物信息学分析10-15

摘要:利用PCR-SSCP方法检测了CRP基因在中国荷斯坦奶牛群体中的单核苷酸多态性,并用各种网络分析软件分析了单核苷酸改变对其功能的影响。结果表明:CRP基因在P1引物扩增片段中存在PCR-SSCP多态性并引起编码氨基酸的改变。经测序分析可知,位于P1引物扩增片段内存在G→T突变,该突变位点使编码的氨基酸发生Q→H的改变。对引起编码氨基酸的P1位点进一步进行生物信息学分析发现,由于编码的改变引起新的转录结合们点vaccinia-term-s的产生,但没有引起其它CRP二三级结构的变化。这一分析结果可为奶牛CRP基因突变所产生的性状功能的改变提供分子水平的解释。

基于GPL软件的小型生物实验室计算服务解决方案16-19

摘要:针对小型实验室特点和实际需要,提出并实现一个以服务器-客户机模式,涵盖web服务,生物序列分析,生物芯片数据分析,实验数据统计处理,文献服务等计算机辅助的通用解决方案。该解决方案已经应用在批量ESTs电子注释和寄生虫病分子诊断的靶序列筛选上。可作为小型实验室生物信息学基础设施部署。

前列腺癌多阶段相关枢纽蛋白的差异共表达模式20-23

摘要:通过枢纽蛋白与其互作邻居之间的共表达关系在从前列腺正常组织到原位癌及原位癌到转移的两个发展阶段的变化,寻找在前列腺癌发生和发展过程中动态改变的枢纽蛋白,为探讨前列腺癌的发病与转移机理提供线索。基于前列腺正常组织、原位癌与癌转移后组织的基因表达谱数据,在前列腺癌的两个发展阶段分别检测到1578和2347个动态改变的枢纽蛋白。平均超过95%的在一个发展阶段动态改变的枢纽蛋白与在另一发展阶段动态改变的枢纽蛋白中的至少一个蛋白共享显著多的互作邻居。另外,两组动态改变的枢纽蛋白中有780个交叠蛋白,其中大约50%的蛋白与其互作邻居之间的共表达关系在两个发展阶段的强弱变化方向相反。结果提示,在前列腺癌的发生和发展过程中,动态改变的枢纽蛋白影响的功能通路高度一致,但是它们与其互作邻居之间有着不同的共表达模式。

甘蔗MYB2转录因子的电子克隆和生物信息学分析24-27

摘要:用电子克隆方法获得甘蔗MYB2基因,采用生物信息学方法,对该基因编码蛋白从氨基酸组成、理化性质、跨膜结构域、疏水性/亲水性、亚细胞定位、高级结构及功能域等方面进行了预测和分析。结果表明:甘蔗MYB2基因全长991bp,包含570bp的ORF,编码189个氨基酸。甘蔗MYB2基因包含有MYB功能域,在序列组成、高级结构及活性位点等方面,与玉米等其它植物的MYB2基因具有高度的相似性。研究结果为该基因的实验克隆奠定基础。

支持向量机在害虫发生量预测中的应用28-31

摘要:害虫发生量与其影响因子之间具有复杂的非线性和时滞性关系,传统方法不能很好的分析和拟合高度非线性的害虫发生量变化规律,导致预测精度不理想。为了有效构建害虫发生量与其影响因子之间复杂的非线性关系模型,提高害虫发生量预测精度,提出一种基于支持向量机的害虫发生量预测方法。该方法首先通过F测验对害虫发生量的最佳时滞阶数进行确定,并利用最佳时滞阶数对样本进行重构;然后利用前向浮动因子筛选法对害虫发生量的影响因子进行筛选,筛选出对预测结果贡献大的影响因子;最后采用10折交叉验证得到害虫发生量的最优预测模型。采用粘虫的幼虫发生密度数据在Mat-lab7.0平台下对该方法进行测试与分析,实验结果表明,相对于其它预测方法,支持向量机提高了害虫发生量的预测精度,克服了传统方法的缺陷,更适合于非线性、小样本的害虫发生量预测。

酵母基因组中ORF数目与长度的关系32-34

摘要:根据NCBI数据库中基因注释序列及相关注释文件,统计了酿酒酵母基因组中不同长度的开阅读框架(Open ReadingFrame,ORF)的数目,分析了开阅读框架的数目随长度的分布关系,结果发现有明显的规律性。根据分布的特点用各种分布模型进行拟合比较,提出这类分布是Г(α,β)分布的假设。进一步根据Г(α,β)分布估算了酵母基因组蛋白质编码序列的数目为5870个。该结果对于基因注释具有一定的参考价值。

葡萄中蔗糖转运蛋白家族的序列分析及功能推测35-38

摘要:以葡萄中的蔗糖转运蛋白为主要研究对象,结合了功能研究较为深入的拟南芥和水稻蔗糖转运蛋白家族序列,分析讨论了这些基因在启动子区域顺式作用元件的异同,以及这些差异可能对mRNA的转录带来的影响;同时,根据蔗糖转运蛋白氨基酸序列对其家族进行了分类,分析了不同亚类蔗糖转运蛋白基因结构的特点;最后还对蔗糖转运蛋白家族中氨基酸的保守性进行了分析。这些分析将为后续蔗糖转运蛋白功能基因组学的研究以及通过基因工程技术精确调节植物代谢提供一定的依据。

探讨生物信息标准化研究39-41

摘要:针对生物信息在国内的发展现状,提出研制生物信息标准的需求。首先从生物数据资源收集、管理规范入手,在此基础上进行了生物信息资源管理体系的研究,最后讨论了共享交流软件系统的开发和生物信息数据挖掘,并期望通过以上研究能为我国生物信息学相关标准的制定提供参考和依据。

基于打分矩阵的多类蛋白质折叠子的预测42-45

摘要:依据蛋白质折叠子中氨基酸保守性,以氨基酸、氨基酸的极性、氨基酸的电性以及氨基酸的亲—疏水性为参数,从蛋白质的氨基酸序列出发,采用"一对多"的分类策略,通过构建打分矩阵和选取氨基酸序列模式片断,利用5种相似性打分函数对27类折叠子进行识别,最好的预测精度达到83.46%。结果表明,打分矩阵是预测多类蛋白质折叠子有效的方法。

用于生理组学协同研究的跨层次建模标记语言(M3L)46-49

摘要:根据生理组学多领域多层次协同研究的需求,针对中国生理组学研究的特点,设计了一种跨层次建模标记语言(Mul-tiscale Modeling Markup Language,简称M3L),规范研究过程中的信息描述方法,实现了数学模型和计算数据的开放式共享和重用。M3L包含结构化模型机制、数据存档机制、信息交互与重用机制、数学描述机制、可视化模型及附件描述机制。M3L中针对人体和小动物解剖结构数据的特殊设计实现了结构与功能信息的关联,促进了中国生理组学研究中模型和数据的标准化描述;M3L以跨层次结构化的方式描述模型,符合生理组学研究模型的特点,满足了协同开发的需求。

猪精浆蛋白基因PSP-Ⅰ和PSP-Ⅱ启动子序列克隆及生物信息学分析50-53

摘要:分别用PCR方法扩增了1.7kbp和1.6kbp的猪PSP-Ⅰ和PSP-Ⅱ基因的启动子,并进行TA克隆,测序鉴定,测序结果用DNAstar程序与Genebank中的相应序列进行对比分析,结果显示与已发表序列的同源性分别为99.8%和96.3%。利用生物信息学的方法对克隆的1.7kbp和1.6kbp的猪PSP-Ⅰ和PSP-Ⅱ基因的启动子区进行了预测分析。PSP-Ⅰ和PSP-Ⅱ基因序列对比(mVista)分析发现,启动子0→-1000bp的保守性较高,其中0→-200bp核心启动子部分的序列同源性达到了100%,而-1000bp上游序列的保守性则较低。启动子的位置预测(Promoter Scan)结果显示,转录起始点上游200bp的区域为两基因的核心启动子位置。启动子区转录因子结合位点预测(TFSEARCH)发现,转录起始位点上游的1000bp区域内含有大量的顺式调控元件,并且得到了一系列潜在的转录因子结合位点。

链球菌属纤连蛋白结合蛋白的生物信息学分析60-64

摘要:对链球菌属纤连蛋白结合蛋白进行系统的分析,找出其特征,为以后的研究奠定基础。通过MUSCLE、BLASTP、PSI-BLAST、PHYLIP、Perl编程等生物信息学方法对217条候选纤连蛋白结合蛋白进行研究。发现共有31个序列纤连蛋白结合蛋白重复单元序列模体,绝大部分蛋白由两个或两个以上的不同模体序列构成,其保守结构域组合呈现多样性等特征。表明链球菌属纤连蛋白结合蛋白重复单元序列模体不是严格统一的,总体上具有变异性,但模体之间又有很大的相似性。

BDCGrid:基于Globus的生物信息高性能计算网格系统65-67

摘要:随着分子生物信息数据量高速增长,生物信息学面临着大规模、高通量、密集型计算的巨大挑战。为有效利用计算机资源,缩短高通量生物信息计算程序执行时间,我们基于Globus Toolkit网格中间件,实现了一个支持高通量生物数据计算的网格系统(Biological Data Computing Grid,简称BDCGrid)。BDCGrid计算网格系统模型可以有效整合中小型生物信息学实验室计算机资源,大大缩短高通量生物信息计算程序执行时间,为相关研究人员利用现有计算机资源处理大规模、高通量生物信息计算任务提供一种新的途径。

人代谢网络巨强连通体的复杂网络分析68-71

摘要:采用复杂网络理论分析了人代谢网络的巨强连通体。通过对高质量人代谢网络数据的整理,获取了该网络巨强连通体中的所有代谢反应。用代谢物图表示这些反应形成了一个网络,它包含了256个节点和648条连线。选用模拟退火算法对该网络进行社团结构分析,发现得到的模块具备重要的生物学功能。通过多种不同的中心化方法,分析了该网络的关键节点,并讨论了它们的生物学和理疗意义。

小鼠EDNRB基因启动子生物信息学分析72-75

摘要:EDNRB/EDN3/ECE-1信号传导通路在胚胎发育期神经嵴细胞分化、迁移、发育为神经节细胞的过程中起到关键作用。采用进化足迹法,利用生物信息学在线软件分析先天性巨结肠相关EDNRB基因启动子序列,结果显示:小鼠EDNRB基因定位于14号染色体,编码442个氨基酸,分子量为:49430Da,转录起始点300bp左右可能为启动子区域,启动子区域包含长度为1473bp的CpG岛,存在两段保守序列,人类和小鼠保守区域内含有33个共同的转录因子结合位点。