生物信息学杂志-2009年第04期-学术点评

生物信息学 2009年第04期杂志文档列表

一种基于支持向量机的自适应肿瘤分类检测算法243-247

摘要：根据肿瘤分类检测模型的特点，提出了一种新的算法，该算法结合使用了基因选择和数据抽取的有效方法，并在此基础上使用支持向量机对基因表达数据进行分类或者检测。其中乳腺癌的分类交叉验证结果由88．46％提高到100．0％，急性白血病的也由71．05％提高至100．0％。实验结果说明了这一方法的有效性，为在大量的基因表达数据中提高检测癌症的准确性提出了一种比较通用的方法。

基于氨基酸特征序列对人类Rh血型系统的蛋白质结构分析248-251

摘要：利用代数学中同态思想和物理中的“粗粒化”思想，以及HP模型，根据a，t，c，g的化学结构分类，提出了DNA序列的特征序列概念（σ-，τ-，σ∩τ-）并推广到蛋白质序列中，从而给出一种数值刻划，将蛋白质序列简化成一个（0，1）序列，基于上述给出特征序列的方法，根据氨基酸分子量与简并度的关系，提出了另外一种DNA序列的特征序列概念（-）并推广到蛋白质序列中，进而给出了另外一种数值刻划，将蛋白质序列简化成一个（0，1，2）序列，通过比较RHD基因和RHCE基因的特征序列的数值刻划图，得出RHD基因和RHCE基因均偏爱使用低分子量且高简并度的氨基酸。

基于多样性指标的分枝杆菌蛋白质亚细胞定位预测252-254

摘要：由于蛋白质亚细胞位置与其一级序列存在很强的相关性，利用多样性增量来描述蛋白质之间氨基酸组分和二肽组分的相似程度，采用修正的马氏判别式（这里称为IDQD方法）对分枝杆菌蛋白质的亚细胞位置进行了预测。利用Jackknife检验对不同序列相似度下的蛋白质数据集进行了预测研究，结果显示，当数据集的序列相似度小于等于70％时，算法的预测精度稳定在75％左右。在对整体852条蛋白质的预测成功率达到87．7％，这一结果优于已有算法的预测精度，说明IDQD是一种有效的分枝杆菌蛋白质亚细胞预测方法。

基于支持向量机的蛋白质相互作用识别255-257

摘要：支持向量机（SVM）是广泛应用于各个领域的分类算法，包括生物信息学。本研究应用SVM作为蛋白质相互作用的分类算法，所用蛋白质相互作用数据下载于墨尼黑生物信息学中心的酿酒酵母数据集，包含有6736条蛋白质，其中相互作用的有4837对，不相互作用的有9674对。提取蛋白质主要结构的电荷和等电位点特征，并应用SVM分类算法对此进行了分类。结果显示，分类的正确率在60％左右，但是较系统发育谱法还是获得了较高的分类正确率。

肌球蛋白动力冲程分布研究258-260

摘要：通过建立肌球蛋白工作循环的四态模型，利用化学动力学方法，讨论了动力冲程过程的几率和无机磷酸盐的释放率是影响动力冲程分布的两个重要因素，得到动力冲程的大小近似呈均值为（8-10）nm的高斯分布。

支持向量机方法预测蛋白质结构中的二硫键261-263

摘要：在蛋白质结构预测的研究中，一个重要的问题就是正确预测二硫键的连接，二硫键的准确预测可以减少蛋白质构像的搜索空间，有利于蛋白质3D结构的预测，本文将预测二硫键的连接问题转化成对连接模式的分类问题，并成功地将支持向量机方法引入到预测工作中。通过对半胱氨酸局域序列连接模式的分类预测，可以由蛋白质的一级结构序列预测该蛋白质的二硫键的连接。结果表明蛋白质的二硫键的连接与半胱氨酸局域序列连接模式有重要联系，应用支持向量机方法对蛋白质结构的二硫键预测取得了良好的结果。

DNA序列的多重分形Hurst分析264-267

摘要：为了深入研究基因组序列的多重分形性质，首先选取12条较长的DNA序列，并根据此12条DNA序列的编码／非编码片段将DNA序列转换成相应的12条时间序列，其次对这12个时间序列进行多重分形Hurst分析，计算它们的Hurst指数，并且利用Hurst指数分析序列的自相似性，进一步将得到的Hurst指数与DNA一维游走模型相比较，发现12条序列均具有长程相关性，这说明DNA序列中确实存在着长程相关现象。

rDNA ITS区序列分子标记技术在植物学研究中的应用268-271

摘要：在植物学研究中，人们越来越多地采用核糖体DNA内转录间隔区（ITS）作为分子标记。本文对近10年来rDNA ITS序列在植物系统发育、分类与鉴定、种质资源以及病虫害的鉴定与防治中的应用等方面的研究进展进行了综述，并对ITS序列的应用前景进行了初步探讨。

Tup1突变对转录抑制局部网络中基因表达的非线性影响272-276

摘要：研究基因网络的非线性行为特征是研制基因网络技术的基础。Tup1基因是酵母中作用最为广泛的转录抑制因子之一，利用酵母生物信息学数据库中蛋白相互作用关系，构建一个以Tup1为中心，4个层次741个基因的局部基因网络。统计分析六张Tup1不同突变的基因表达芯片数据，将局部基因网络中的全部基因按照3个网络特征进行统计分析：必需、非必需基因、网络层次和网络节点，并研究这些特征与基因表达之间的关系。初步发现基因表达变化的强度与节点数目成一定的反比关系，必需基因的平均变化程度较非必需基因为低，且由Tup1突变引发的其他基因的表达变化在以Tup1为中心的局部基因网络中近层次网络变化程度较大，远层次网络变化程度较低。

植物标本制作工艺的改良277-279

摘要：用于教学的植物标本主要有浸液标本和腊叶标本。蜡叶标本在使用过程中破损严重，浸液标本囡其笨重的外形不适用于大范围的教学研究。现通过叶片含水量检测、植物种子超干实验等一系列对比实验，针对教学标本工艺进行改良，以册的形式，对标本进行整理归纳，形成适应普通教学的简易植物标本数据库。

结合蛋白质相互作用数据进行基因表达数据聚类280-283

摘要：提出了一种蛋白质相互作用的相似性度量，将其与基因表达数据的相似性度量相结合，定义了一种融合的距离度量，并且将这种融合的距离度量用于改进现有的K—means聚类方法。经过实际数据的检验，改进后的K—means方法比常用的其它几种聚类方法具有更好的效果，说明结合蛋白质相互作用数据可以使得基因表达聚类的结果更有生物意义。

重金属结合肽（蛋白）的结构分析284-287

摘要：金属离子与金属结合肽（蛋白）的相互作用与应用研究，一直是生物无机化学的重点和热点，也是分子间相互作用研究领域的难点。本研究利用ClustalX、BLAST等生物信息技术与方法对大量已知的重金属结合肽进行分析与数据挖掘。确定筛选获得的重金属结合肽常富含His，无Cys，无金属结合肽模式序列，进化不保守；部分氨基酸序列结构（如六肽）可在蛋白数据库中找到相似序列。序列特征主要为Zn^2＋相关的转录因子。本研究为重金属结合蛋白-重金属离子的相互作用分析简化为重金属结合肽-重金属离子的结构模拟与分析提供了重要的理论基础和研究手段。

蛋白质折叠速率与其氨基酸序列极性的关系288-291

摘要：以大肠杆菌60个蛋白酶以及几种常见病毒（SARS病毒、艾滋病病毒、丙型肝炎病毒及乙型肝炎病毒）各蛋白质序列中的所有α-螺旋和β-折叠片段为研究对象，计算了各片段的折叠速率和平均极性，分别在各物种的α-螺旋和β-折叠两类二级结构片段中分析了二者的相关性。得到结论：不论是大肠杆菌中的蛋白酶还是病毒蛋白，其中的两类氨基酸片段的平均极性与折叠速率都是极显著相关的：对于所有的α片段，二者呈线性正相关，而对于所有的β片段，二者成线性负相关。结果证实了在蛋白质折叠中，氨基酸的极性起着重要的作用。

肠道病毒71型基因组中小干扰RNA的靶位点预测292-294

摘要：肠道病毒71型（EV71）已经在世界范围内有过十多次大的爆发与流行，近年来EV71病毒的流行在亚洲逐渐呈上升的趋势，但是目前尚无有效的治疗措施，因此迫切需要一种治疗EV71的有效药物。本文采用生物信息学的方法，对人类EV71病毒三个不同株型（SHZH03，SHZH98和MS）RNA序列的局域二级结构进行了预测，并从这些病毒株的基因组中分别得到了长度在21～25nt的小干扰RNA靶序列碱基片段。这一结果将有助于治疗EV71药物的开发研究，对预防和控制EV71的爆发和流行也会有重要意义。

带噪生物实验数据的不确定支持向量数据描述295-299

摘要：在对候选基因进行排序时，支持向量数据描述（SVDD）可以用来描述各种异构的数据源，如序列数据、学术文献数据、各种生物实验数据等。由于生物实验数据带有噪声，在用SVDD对其描述时，会遇到噪声的影响。本研究通过公式推导扩展了原始的SVDD，提出不确定支持向量数据描述（USVDD），用来降低噪声的影响。利用酵母基因表达数据进行实验，结果表明该方法比标准的SVDD对带噪声的数据具有更好的描述能力。

牙鲆弹性蛋白酶cDNA全长和蛋白质结构分析300-303

摘要：为研究牙鲆丝氨酸蛋白酶家族的功能和及其家族的分子进化规律，从本实验室已构建的牙鲆肝胰脏cDNA文库进行了部分测序，从而筛选出一个弹性蛋白酶新成员：弹性蛋白酶5。在此基础上，结合Genbank数据库中已经提交的胰凝乳蛋白酶和胰蛋白酶，对三者蛋白质进行了序列分析和三维结构的比较。牙鲆弹性蛋白酶cDNA包含一个完整的读码框（提交Genbank的登录号为EU873084）。其编码区平均GC含量为54％，推测编码的蛋白质包含296个氨基酸，分子量为29．04KD，等电点为6．14。蛋白序列比较表明它和牙鲆弹性蛋白酶3相似性最高。通过同源建模得到弹性蛋白酶5的三维结构和牛胰凝乳蛋白酶结构相似，包含了2个α螺旋、β个8折叠和13个转角结构。牙鲆弹性蛋白酶、胰凝乳蛋白酶和胰蛋白酶中底物结合区的3个关键氨基酸有明显的区别，这些氨基酸的变化改变了底物结合位点开口的大小，胰凝乳蛋白酶2的三个关键氨基酸和牛胰凝乳蛋白酶相同，该区域能接受结构较大的芳香族氨基酸；胰蛋白酶3能更好的结合阳性氨基酸Lys或Arg；而弹性蛋白酶开口很小，只能结合小的残基。上述结果证明了牙鲆丝氨酸蛋白酶家族中的弹性蛋白酶、胰凝乳蛋白酶和胰蛋白酶底物结合位点的结构差异决定了其对底物选择的特异性。

《生物信息学》课程教学方法探索与实践311-313

摘要：从教学实践出发，探讨开设生物信息学选修课的教学大纲、内容及方法，为提高学生综合能力提供一种教学模式。

准噶尔小胸鳖甲抗冻蛋白基因Mpafp149的生物信息学分析314-319

摘要：利用生物信息学方法对准噶尔小胸鳖甲抗冻蛋白基因Mpafp149所编码蛋白MPAFP149进行分析，分别从氨基酸组成、理化性质、二三级结构和功能、进化关系等方面进行预测。结果表明MPAFP149与其他昆虫抗冻蛋白在氨基酸水平上具有79％的相似性，二级结构上预测其为水溶性蛋白，含有信号肽和跨膜区。三级结构上与黄粉虫抗冻蛋白YL-1具有较高的相似性，并且具有昆虫抗冻蛋白所特有的结构域。本研究为准噶尔小胸鳖甲抗冻蛋白功能的研究鉴定了基础。

生物信息学杂志统计源期刊

China Journal of Bioinformatics

中学生物教学

现代生物医学进展

医学信息学

生物技术进展

生物技术世界

生物多样性

生物化工

口腔生物医学

国际生物医学工程

生物加工过程

期刊咨询

期刊推荐

文秘服务

生物信息学 2009年第04期杂志文档列表

生物信息学杂志 统计源期刊

China Journal of Bioinformatics

中学生物教学

现代生物医学进展

医学信息学

生物技术进展

生物技术世界

生物多样性

生物化工

口腔生物医学

国际生物医学工程

生物加工过程

期刊咨询

期刊推荐

文秘服务

生物信息学 2009年第04期杂志 文档列表

生物信息学杂志统计源期刊

生物信息学 2009年第04期杂志文档列表