单分子测序改善微生物基因组组装
美国国家生物防卫分析和反制中心的研究人员近日在《GenomeBiology》上发表文章,介绍了SMRT技术在微生物基因组组装上的应用。他们认为,单分子测序数据能降低测序费用,并带来更多完整的基因组,改善微生物基因组数据库的质量。
随着测序费用的不断下降,测序项目的数量也在不断上升。GOLD(在线基因组数据库)中的项目数量增加了4倍,从2007年到2905到2011年的11472。然而,许多现有的基因组是严重片段化的。在GOLD数据库中,仅有32%的基因组是完整的(complete),意味着没有缺口,而finished级别的基因组更少。
然而,考虑到测序数据的量和所需的人力,填补这些缺口几乎不可能。于是,科学家们开始考虑读长很长的单分子测序,即PacificBiosciences公司的SMRT技术。
在这项研究中,SergeyKoren及其同事为了了解单分子测序在微生物基因组组装中的优势,对6个细菌基因组进行了测序和组装,并分析了近2,300种细菌和古细菌的重复复杂性。研究结果表明,利用单个PacBioRS测序文库,大部分已知的细菌和古细菌基因组都能被很好地组装,达到finished级别。
作者还仔细研究了以这种方式完成微生物基因组的成本问题。他们认为,依赖单个PacBio文库制备,能使成本降低,准确性上升。他们在文中写道:“单个文库的组装比典型的短read组装以及短和长read混合组装更加准确。”对于大部分微生物基因组,填补缺口的费用在1000美元以下,且未来随着技术发展有望继续降低。
作为项目的一部分,研究人员还利用Illumina、454和PacBio测序仪对6种GC含量不同的基因组进行了测序。他们认为,对于几乎所有基因组,PacBio组装就连续性、错误率和组装可能性分数而言优于混合组装。
作者认为,长的单分子read足以实现大部分已知微生物基因组的完整组装。通过这种方法,有望增加完整基因组的数量,改善微生物基因组数据库的质量,并实现高保真、群体规模的泛基因组和染色体结构研究。(生物通薄荷)