生物信息学杂志-2010年第02期-学术点评

生物信息学 2010年第02期杂志文档列表

水稻全基因组编码抗病基因同源序列分析91-97

摘要：利用模糊搜索的方法,在TIGR水稻日本晴基因组数据库（TIGR Rice Genome Annotation - Release 5）中识别出565个编码抗病蛋白质的同源序列;利用识别出565个编码抗病蛋白质序列分别与籼稻基因组数据库进行BLASTP联配,共确定320个对应的等位基因.通过在线生物信息学软件,识别了这565个抗病基因的保守结构域、保守模体和DNA序列内转座子元件,其中有14个抗病基因同源序列注释错误.同时绘出了这些基因的基因组分布,并基于这些基因的同源树分析和基因组物理分布,认为基因的原位和远程复制事件产生了抗病基因的现存分布和多样性,其中转座子在复制过程中扮演了重要角色.这些对抗病机制研究和抗病基因进化研究以及抗病基因的转育具有重要意义.

癌症基因表达谱挖掘中的特征基因选择算法GA／WV98-103

摘要：鉴定癌症表达谱的特征基因集合可以促进癌症类型分类的研究,这也可能使病人获得更好的临床诊断？虽然一些方法在基因表达谱分析上取得了成功,但是用基因表达谱数据进行癌症分类研究依然是一个巨大的挑战,其主要原因在于缺少通用而可靠的基因重要性评估方法.GA/WV是一种新的用复杂的生物表达数据评估基因分类重要性的方法,通过联合遗传算法（GA）和加权投票分类算法（WV）得到的特征基因集合不但适用于WV分类器,也适用于其它分类器？将GA/WV方法用癌症基因表达谱数据集的验证,结果表明本方法是一种成功可靠的特征基因选择方法.

基因表达数据聚类分析技术及其软件工具104-109

摘要：随着DNA芯片技术的广泛应用，基因表达数据分析已成为生命科学的研究热点之一。概述基因表达聚类技术类型、算法分类与特点、结果可视化与注释；阐述一些流行的和新型的算法；介绍17个最新相关软件包和在线web服务工具；并说明软件工具的研究趋向。

β-KL离散量在识别DNA编码区域中的应用110-113

摘要：根据DNA序列的＇终止密码子＇及其＇逆补终止密码子＇的分布情况,给出一种新的DNA序列向量的构建方法,运用Shannon熵相关理论,对Jensen-Shannon离散量和KL离散量进行了修正和比较.试验表明,该方法在预测DNA序列的基因编码与非编码区边界的效率上是86%显著高于Bernaola等人提出的70%.

拟南芥LEC同源基因的生物信息学分析114-117

摘要：用生物信息学方法对拟南芥叶状子叶（LEC）基因的核苷酸序列以及推导氨基酸序列的组成、功能结构域、亲水性等进行了分析.结果表明,拟南芥的LEC 蛋白为位于细胞核中的亲水性不稳定蛋白;通过对LEC蛋白的功能结构域的分析发现,LEC1和L1L蛋白中高度保守的区域即为CBF-NFYB-HMF结构域,LEC2和FUSCA3 蛋白中高度保守的区域为B3结构域.

拟南芥、水稻和杨树JMJC家族全基因组分析118-123

摘要：采用HMMER与BLAST相结合的方法确定拟南芥，水稻和杨树三种模式植物全基因组JMJC蛋白基因个数分别为21，20，24，并对其染色体定位，基因结构，保守功能域进行了系统分析，在系统进化分析基础上，将JMJC家族分为11个亚家族，内含子外显子结构分析与MPSS表达模式分析结果也进一步支持了进化关系研究．本研究有助于揭示植物JMJC基因家族的进化历史，为后续JMJ基因家族的功能提供线索，为进一步研究植物JMJC基因家族提供理论基础。

药物靶标蛋白在蛋白网络中的分布124-126

摘要：药物靶标发现是目前生物学研究领域的热点和难点问题。从已有药物靶标中寻找规律可以为新靶标的发现总结规律，提供依据。随着功能基因组学的发展，这种组学数据的积累为这一问题的研究提供了契机。本文研究了已有靶标在蛋白网络中的分布，并分析了它们的蛋白功能域组成情况。结果显示靶标基因倾向位于网络的核心区域，并且集中在一些特定蛋白家族中。这些规律的总结将对药物研发过程中药物靶点的选择提供一定的帮助。

酵母核糖体蛋白基因组合转录调控位点统计分析127-133

摘要：真核基因的转录调控是后基因组时代研究的主要问题之一，其基础是认识DNA上转录因子结合位点（模体）及分布状况。基于马尔可夫链模型对酵母核糖体蛋白基因上游启动子序列中模体出现次数进行统计，利用z—score统计量抽提出过表达和低表达的模体，其中95％的模体与实验得到的转录因子结合位点相符合。然后将抽提出的模体两两配对，通过与背景序列比较，找出酵母核糖体蛋白基因中出现概率及距离分布均具有统计显著性的模体对，这些非随机出现的模体对具有潜在的组合转录调控功能，其中一些模体对的组合调控作用已有实验支持。对提取出的模体对在序列中的位置分布进行分析，发现近94％的模体对位于转录起始位点上游，超过半数的模体对两模体之间的最短距离在0—100bp之间，距离小于30bp的模体对接近30％，这样的短距离间隔有利于两模体的相同作用。这些结果将有助于对酵母核糖体蛋白基因转录调控机制的深入科芳.

PCR引物特异性核查系统（PSC）的构建与应用134-138

摘要：聚合酶链式反应（PCR）虽已广泛用于分子生物学研究中,然而PCR实验中的非特异性产物问题将直接影响PCR的效率,在多重PCR实验中更是如此.为了最大限度地降低非特异性产物的出现率,同时避免用户频繁使用Blast比对检查非特异性,我们开发了基于NCBI-Blast的引物评估和模板DNA特异性结合能力评估的核查系统PSC（Primer Specificity Checking,http：//biocompute.bmi.ac.cn/PSC）,并基于虚拟PCR实验确定了用于引物质量核查计算的多种参数,能够在线提供多个物种的引物特异性核查结果.该系统可以有效地对引物序列可能产生的所有非特异性扩增进行预测,有助于实验前引物优化或者对非特异扩增结果进行解释,最终达到提高PCR效率的目的.

基于RefSeq的人类基因荧光定量PCR引物库的构建139-141

摘要：利用NCBI提供的RefSeq序列,通过BLAT、Sim4和自主开发的剪接比对程序Ealter1.0对人类RefSeq转录本进行外显子预测,根据预测的外显子信息,采用自主开发SYBR Green I Real Time PCR引物设计程序E-qPCR-Design1.0高通量设计21,118对SYBR Green I Real Time PCR引物,同时选取5 000条基因进行SYBR Green I Real Time PCR引物验证,95.92%的基因引物取得良好效果,1.64%的基因引物产生引物二聚体,1.08%的基因引物有非特异性扩增,通过生物信息技术分析与实验验证,建立了基于RefSeq的人类基因荧光定量PCR引物库.

基于相对密码子频率的芜菁花叶病毒基因组序列的进化分析142-146

摘要：现有92株芜菁花叶病毒（TuMV）的全基因组序列已在GenBank报道,据分析报道其中58株不含重组序列.利用系统聚类法对92株TuMV的全基因组序列和58株TuMV全基因组序列的相对密码子频率RSCU值进行聚类分析.同时利用系统发育分析方法分析了这92株和58株TuMV全基因组序列.结果发现,92株芜菁花叶病毒株的密码子偏性聚类树与其系统进化树的一致度很低;而不含重组序列的58株芜菁花叶病毒株的密码子偏性聚类树与其系统进化树的一致度却非常高,且与寄生宿主类型基本对应.这表明在不存在重组的情况下,TuMV密码子频率的偏性可能是宿主内的一种选择压力,影响TuMV基因组的点突变进化方向,促使TuMV适应宿主内环境.

基于SAS的多元统计方法实现芯片数据挖掘147-149

摘要：利用SAS软件对GEO的一个肺癌芯片实验进行挖掘.采用非参数检验,判别分析和回归分析对该芯片实验中14个核受体的表达信息进行分析.结果表明,在0.05显著性水平下,ER1、VDR、 RARα和 RORα四个基因在腺癌和鳞癌表达具有统计学差异;RARβ在复发组和非复发组表达有差异.判别分析结果显示VDR和RORα表达量可以对病理类型进行预测,但是总误判率很高（0.238 9）;RARβ和PPARα对判别是否复发的总误判率更高（0.345 7）.建立回归方程预测病理类型,入选模型的变量也是VDR和RORα,两者OR分别为0.126和4.452.可见,基于SAS的多元统计方法是芯片数据挖掘的一种潜在方法,一旦芯片实验标准化,利用SAS对不同芯片实验数据整合分析的结论将有益于推动假说形成.

VersusSNP：一种单碱基突变的筛选及分类工具150-152

摘要：单碱基突变的筛选和分类是SNP分析的基础。为解决手工进行突变位点挖掘工作的困难，编写了VemusSNP软件。它可以解析并过滤序列比对结果，并根据突变类型将位点加以分类，以图形界面呈现给用户。使用VemusSNP，用户可以直观地了解基因组中单碱基突变的情况。其程序及源代码可以从http：／／sourceforge．net／projects／versussnp下载。

生物学软件在线粒体DNA序列多态性分析中的应用153-155

摘要：对线粒体DNA（mtDNA）序列进行多态性分析，将有利于从母系遗传的角度研究各人群的源流、迁移以及亲缘关系等情况。探讨利用Intemet共享生物学软件对各种生物样本mtDNA高变区进行序列比对分析及多态性分析，结果显示DNAstar、ClustalX、DnaSP以及Mega等软件操作简便、易于判读、结果准确可靠，可广泛应用于人类学、系统发育学以及法医鉴定等领域的研究。

基于CGR的DNA序列的时间序列模型156-160

摘要：利用DNA序列的混沌游戏表示（chaos game representation,CGR）,提出了将2维DNA图谱转化成相应的类谱格式的方法. 该方法不仅提供了一个较好的视觉表示,而且可将DNA序列转化成一个时间序列.利用CGR坐标将DNA序列转化成CGR弧度序列,并引入长记忆ARFIMA（p,d,q）模型去拟合此类序列,发现此类序列中有显著的长相关性且拟合度很好.

Swami一新一代生物学平台161-164

摘要：生物信息学的发展产生了越来越多的数据库和生物学软件，研究人员在应用这些生物学工具处理实验数据时需要大量的时间解决数据格式转换和管理等问题。本文介绍了一种交互式的基于网络的新一代生物信息学分析平台一Swam，它综合了主要的生物信息学数据库和软件，可以加速数据处理并帮助用户管理数据。因此它将推动生物信息学向更深层次发展。

油料作物EST资源的生物信息学分析165-170

摘要：利用生物信息学方法,收集整理GenBank数据库中截至2008年5月收录的油料作物油菜、花生、芝麻、大豆、向日葵、蓖麻、亚麻、棕榈等八种油料作物的表达序列标签（EST）序列信息,共获得1,185,911条EST 序列,使用Crosmatch、RepeatMasker、Phrap、CAP3、EMBOSS、Blast、EST-pipeline、ORF finder、Interproscan、blast2go、IdentiCS等软件,基于Linux 操作系统,进行了综合及分类分析.共获得289,892条UniEST序列,通过以上对EST序列信息的基因注释信息,筛选出与油脂代谢相关的基因信息,并以此为基础构建了油料作物油脂代谢途径比较结构图.本研究为油料作物油脂代谢相关基因数据库的构建和不同油料作物油脂代谢异同的比较打下基础.

神经网络提高肝细胞癌磁共振波谱诊断正确率171-174

摘要：通过评价31磷磁共振波谱（31Phosphorus Magnetic Resonance Spectroscopy,31P-MRS）来辨别三种诊断类型：肝细胞癌,正常肝和肝硬化.运用反向传输神经网络（BP）和径向基函数神经网络（RBF）分析31P-MRS数据,分别建立神经网络模型,进行肝细胞癌的诊断分类以期提高识别率.实验结果证明,应用神经网络模型后,31P-MR波谱对活体肝细胞癌的诊断正确率从89.47%提高到97.3%,且BP更优于RBF.

生物信息学杂志统计源期刊

China Journal of Bioinformatics

中学生物教学

现代生物医学进展

医学信息学

生物技术进展

生物技术世界

生物多样性

生物化工

口腔生物医学

国际生物医学工程

生物加工过程

期刊咨询

期刊推荐

文秘服务

生物信息学 2010年第02期杂志文档列表

生物信息学杂志 统计源期刊

China Journal of Bioinformatics

中学生物教学

现代生物医学进展

医学信息学

生物技术进展

生物技术世界

生物多样性

生物化工

口腔生物医学

国际生物医学工程

生物加工过程

期刊咨询

期刊推荐

文秘服务

生物信息学 2010年第02期杂志 文档列表

生物信息学杂志统计源期刊

生物信息学 2010年第02期杂志文档列表