摘要:随着新一代测序技术的发展,一些新的全基因组组装算法应运而生,特别是针对第三代高通量测序仪产生的海量短序列的组装软件被不断开发出来,这些组装软件渐渐走向市场。但是,由于这些组装软件的适用性和其性能的差别,选择一款性能优良的组装工具或者开发并行高吞吐的组装工具成为了当前面临的一大难题。本文选取基于DeBruijn图算法开发的4款DeNovo组装的软件(Velvet、SOAPdenovo、IDBA、ABYSS)对4种物种的基因组的模拟数据进行测试,并从软件的算法、组装性能和组装质量3个方面分析这4个软件的性能,同时根据其算法特点推断影响这些软件性能的关键因素,并给出软件的使用建议以及开发并行序列组装工具来组装超大规模的基因数据应该注意的问题。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社