生物信息学杂志-2014年第02期-学术点评

生物信息学 2014年第02期杂志文档列表

生物信息学杂志研究论文

基于HMM的齿肋赤藓VOZ转录因子的预测与分析77-83

摘要：VOZ（Vascular plant One Zinc finger protein）作为与植物的进化与发育密切相关的基因,在极端耐旱荒漠苔藓植物齿肋赤藓（Syntrichia caninervis）中对VOZ基因进行挖掘和分析有利于更好的揭示VOZ基因的进化关系,且可作为抗逆基因进行更为深入的分子生物学研究。在VOZ转录因子蛋白中VOZ-domain是一个保守的DNA结合结构功能域,利用VOZ-domain多序列联配构建隐马尔可夫模型序列谱能够很好的进行家族成员的识别和预测。利用拟南芥、小立碗藓和水稻等植物已知的转录因子序列信息构建HMM序列谱模型,对荒漠苔藓齿肋赤藓转录组进行比对搜索。最终得到一条新的齿肋赤藓VOZ转录因子ScVOZ1（NCBI/EBI检索号：HG764415）,序列长度为1 495 bp,具有完整的VOZ-domain结构域。生物信息学分析表明其具有转录调控功能和核定位潜能。多序列比对、进化和保守基序分析表明,ScVOZ1蛋白序列与小立碗藓VOZ家族和拟南芥AtVOZ1相似度较高。本研究为进一步研究ScVOZ1基因的功能以及其进化起源奠定了基础。

基于WEB的关键蛋白质预测平台84-89

摘要：关键蛋白质是指那些在蛋白质相互作用网络中承担重要作用、移除后会使蛋白质复合物功能丧失并导致生物无法存活的节点。随着蛋白质数据库的不断完善和高通量技术的发展,使得通过计算方法的关键蛋白预测得到广泛应用。针对目前软件多为桌面应用程序、用户难以迅速适应的情况,本文设计并实现了一个基于WEB的关键蛋白质预测平台EssentialProtein Finder（EP Finder）。该平台集成了DC、BC、CC、EC、LAC、SC和NC7种关键蛋白质预测算法,还提供包含SN、SP、PPV、NPV、ACC、F和折刀曲线图在内的7种评估方法。平台对蛋白质网络图、算法运行及评估结果提供了可视化展示。该平台具有良好的扩展性。

盐胁迫下盐穗木差异表达基因的转录组信息分析90-98

摘要：盐穗木是一种理想的耐盐模式植物,本文利用生物信息学方法分析盐穗木在盐胁迫下差异表达基因的转录组,为盐穗木耐盐机理及耐盐关键基因的储备提供理论依据。基于盐穗木在盐胁迫（600 mM NaCl）下差异表达的转录组数据,以代谢通路中基因表达数量最多的7条通路和与胁迫刺激响应相关的共8条通路为主要研究内容,筛选出上调和下调表达差异显著的unigene,将其与NCBI数据库中所有物种相关基因进行Blastx比对,筛选出通路中上调和下调差异表达最显著的unigene,同时对差异表达活跃的unigene进行分类汇总。共得到23组差异表达活跃的基因类群,分别是乙烯响应因子、WRKY转录因子、Myb转录因子、bZIP转录因子、葡聚糖酶、6-磷酸脱氢酶、醛脱氢酶、柠檬酸合成酶、蛋白激酶等,推测这些类群的基因在盐穗木耐盐机制中发挥重要作用。

甘蔗细胞色素P450还原酶基因的电子克隆与分析99-105

摘要：旨在为甘蔗细胞色素P450还原酶基因的实验克隆、功能鉴定及其应用提供参考。本研究以甘蔗类似细胞色素P450还原酶基因的EST序列CF576130.1为探针,在甘蔗EST数据库中进行检索,并基于电子克隆技术获得了甘蔗细胞色素P450还原酶基因（Cytochrome P450 reductase）的一条cDNA全长序列,命名为ScCYP450。采用生物信息学方法,对该基因编码蛋白从氨基酸组成、理化性质、亚细胞定位、跨膜结构域、疏水性/亲水性、高级结构及功能域等方面进行预测和分析。结果表明该基因全长1 821 bp,包含一个744 bp的开放阅读框,编码247个氨基酸,该基因编码蛋白定位于细胞内质网（膜）,为可溶性碱性蛋白,不存在信号肽,二级结构原件多为无规卷曲,含有多个保守功能域,主要功能为辅酶因子生物合成和翻译功能。

ILLUMINA Golden Gate DNA甲基化芯片的KL-FCM聚类分析106-109

摘要：DNA甲基化作为一种重要的表观遗传修饰,其甲基化水平被发现与疾病的发生发展密切相关,对其进行聚类分析有希望发现新的疾病亚型并建立有效的疾病预测预后方法。传统的聚类分析方法之一模糊C-均值（FCM：Fuzzy C-means）适用于特征空间呈球形或椭球形分布的场景,缺乏普适性。而Illumina Golden Gate平台通过计算基因的各甲基化位点的甲基化百分比描述其甲基化程度,其值位于（0,1）之间,服从混合贝塔分布,不能直接采用FCM进行聚类分析。鉴于此,本文提出基于KL特征测度的KL-FCM聚类算法,采用各样本间的K-L距离作为样本划分时的度量准则。最后,本文基于KL-FCM算法实现IRIS测试数据集和基因的DNA甲基化水平数据的聚类分析。实验结果表明该方法可以以更低的计算负荷获得优于k-均值（k-means）和传统FCM的分类效果。

Hsc70-Auxilin复合物的拉伸分子动力学模拟110-116

摘要：Hsc70与auxilin蛋白组成的系统是Hsp70/Hsp40分子伴侣系统家族的一员,在热休克反应中发挥重要作用。本文为得出auxilin蛋白J结构域的关键氨基酸,首先采用由二硫键交联的Hsc70 R171C与auxilin D876C的复合物结晶结构作为初始模型,进行分子动力学模拟,通过比较平衡后的结合部位发现,将形成二硫键的氨基酸突变为原来的氨基酸结构在结合位点上与生化结果较为相近,之后利用此结构通过拉伸动力学模拟分析了auxilin蛋白J结构域与Hsc70的ATPase功能域的解离过程,并探讨了Hsc70与auxilin蛋白之间的相互作用力。结果表明位于HPD loop上的His874,Asp876,Thr879,螺旋Ⅲ上的Glu884,Asn895,Asp896,Ser899,Glu902,Asn903为关键氨基酸,这些数据符合之前核磁共振实验证实的T抗原J结构域的HPD基序和螺旋Ⅲ与Hsc70的ATPase功能域之间的相互作用。

生物信息学杂志综述

基于生物信息学的HERV研究现状与发展趋势117-122

摘要：近年来研究证实,人内源性逆转录病毒（HERV）中长末端重复序列（LTR）和囊膜蛋白基因（env）与基因异常表达关系密切。本文阐述了HERV国内外研究现状与发展动态。从生物信息学角度对LTR中启动子、多聚腺苷化（PolyA）信号和增强子等顺式作用元件以及env中的免疫抑制区（ISD）进行了重点分析。指出上述元件和潜在功能区在基因的异常表达和囊膜蛋白的免疫抑制中起关键作用,必将成为HERV与基因异常表达关系研究的热点与趋势。通过此类研究,以期为癌症疾病的早期诊断和治疗靶位点的选择奠定理论基础。

生物信息学杂志研究快报

α/β类蛋白质折叠类型的分类方法研究123-132

摘要：蛋白质折叠规律的研究是生命科学重大前沿课题之一,折叠分类是蛋白质折叠研究的基础。本文基于LIFCA数据库,选取样本量大于2的55种α/β类蛋白质折叠类型为研究对象。结合蛋白质折叠类型的定义及其保守拓扑结构特征,确定了55种蛋白质折叠类型的模板及其对应的特征参数。建立了基于模板的打分函数Mul-Fscore,并结合二级结构参数信息,给出了55种α/β类蛋白质折叠类型的多模板分类方法。用此方法对LIFAC数据库中的931个样本进行检验,分类结果的平均特异性、平均敏感性、MCC值分别为99.58%、79.47%、79.39%。与TM-score分类结果对比发现,Mul-Fscore分类的敏感性与MCC值好于TM-score的相应结果,平均特异性相近。

一种新型的基于图像的DNA序列可视化模型133-139

摘要：传统的DNA序列可视化模型局限于短DNA序列的可视化,并且缺乏对可视化图形的通用分析方法。因此,文章提出了一种基于图像的DNA序列可视化模型,这种模型通过将一维的DNA序列转换为二维的256色的灰度图像,可以实现长DNA序列的可视化,具有很高的空间紧密性。借助成熟的图像处理方法来分析DNA可视化图像,可以获取原始DNA序列的规模、4种不同碱基的分布、无序程度等重要信息。通过比较不同DNA序列的可视化图像,可以获取这些序列的相似性信息。

生物信息学基因表达差异分析140-144

摘要：基因的差异化表达由多种因素共同导致,并且与许多疾病的发生和发展有密切联系,对差异化表达的基因进行生物信息学以及生物统计学的分析对于研究细胞调节机制和疾病机理有着重要意义。目前,对差异化表达的基因有以下几种主流的研究方法：DNA微阵列（DNA microarray）,抑制性消减杂交（SSH）,基因表达连续性分析（SAGE）,代表性差异分析（RDA）,以及mRNA差异显示PCR（mRNA DDRT-PCR）。目前许多基因差异化表达数据是建立在时段（time series）基础上,因此对基于时间变化的基因差异化表达分析变得尤为重要。本文将对差异化表达基因的几种主流方法进行详细阐述,并介绍一种基于傅里叶函数的时段基因差异化表达分析。

国外公众健康信息学发展研究145-150

摘要：通过分析国外公众健康信息学研究的年代分布特点、核心期刊、重要作者和研究热点,探索国外公众健康信息学研究的历史、现状和发展趋势,为国内公众健康信息学领域的研究与实践提供理论参考。利用TDA、Excel等工具,从时间、期刊和作者分布三方面对SCIE数据库收录的公众健康信息学领域的研究文献进行时空维度分析,再进行关键词和高频被引文献分析。从发文量来看国外公众健康信息学研究的发展比较平缓,核心期刊包括医学互联网研究杂志与国际医学信息学杂志,重要作者有Eysenbach Gunther、Keselman Alla等。1994~2013年公众健康信息学研究热点包括基本问题、卫生系统和个人健康记录、健康传播和患者教育以及医学信息学相关学科。高频被引文献内容涵盖公众健康信息学科,公众健康信息系统,电子病历和个人健康记录,互联网对公众健康行为的影响等几个方面。

基于ChIP-seq的差异组蛋白修饰区域的筛选151-156

摘要：组蛋白修饰是在基因组水平上起到重要调控作用的表观遗传修饰,随着ChIP-Seq的广泛使用,高通量数据的积累,为从全基因组研究组蛋白修饰模式奠定了基础。但目前缺乏在多样本间筛选疾病相关的调控区域的方法,因而本文开发了一种多细胞系的差异筛选算法来识别差异组蛋白修饰区域。本文通过窗口移动法来估计组蛋白修饰水平,并根据信息熵理论定量各个细胞系之间的差异。基于随机背景来确定差异显著性阈值。利用此算法来筛选人类全基因组9个细胞系间H3K4me3差异的区域,结果显示这些区域显著富集在基因启动子上和其他重要的染色质状态上,且与先前人们发现的活性启动子染色质状态显著重叠。通过文献挖掘进一步证实了与白血病相关的基因组标记。这些结果表明基于熵的策略可有效地挖掘多细胞系间以及与疾病相关的差异组蛋白修饰。

生物信息学杂志统计源期刊

China Journal of Bioinformatics

中学生物教学

现代生物医学进展

医学信息学

生物技术进展

生物技术世界

生物多样性

生物化工

口腔生物医学

国际生物医学工程

生物加工过程

期刊咨询

期刊推荐

文秘服务

生物信息学 2014年第02期杂志文档列表

生物信息学杂志 统计源期刊

China Journal of Bioinformatics

中学生物教学

现代生物医学进展

医学信息学

生物技术进展

生物技术世界

生物多样性

生物化工

口腔生物医学

国际生物医学工程

生物加工过程

期刊咨询

期刊推荐

文秘服务

生物信息学 2014年第02期杂志 文档列表

生物信息学杂志统计源期刊

生物信息学 2014年第02期杂志文档列表