国内首个Oxford Nanopore测序植物基因组在线发布,第四代基因测序技术起航
2017年9月29日,海南大学、中国科学院华南植物园与永诺生物旗下CookGene公司于NCBI在线发布了檀香(Santalum album L.)的基因组序列信息[1]。据悉,该基因组基于第四代基因组测序技术Oxford Nanopore Technology (ONT)完成组装,这也是目前国内首个采用ONT技术完成的de novo基因组。ONT技术在国内的成功应用为动植物基因组的快速高效组装开启了新篇章。
檀香(Santalum
album
L.)为檀香科(Santalaceae)常绿半寄生植物,在檀香科中檀香油含量最高,具有重要的经济价值。檀香的心材是名贵的中药材;根部、主干碎材可以提炼俗称“液体黄金”的檀香精油;幼枝和生长过程中修剪下的枝条是高档香制品原材料。此外,檀香作为半寄生植物,通过吸器从寄主根系中吸收水份和矿物质,维持生长发育,因此对檀香吸器发育、吸器功能建立和对环境(包括寄主)的适应等特性研究是一直受人关注的科学问题。因此,通过檀香全基因组信息解析,有助于人们对檀香成香相关的次生代谢物质积累以及寄生机制的深入研究,从而为更科学、高效种植檀香和开发利用提供重要依据;同时,为半寄生植物寄生生物学特性的分子机理研究提供模式作用。
在此项研究中,CookGene公司作为国内首批提供ONT测序服务的公司,与海南大学和中国科学院华南植物园合作在本项目研究中构建了檀香基因组测序文库,获得了15Gb的clean测序数据;并利用CookGene与中山大学谢志、肖传乐教授等合作开发最新三代测序组装系统MECAT组装出189Mb基因组序列[2](点击链接,查看此前报道),其中contigs
N50序列高达4.3Mb,详细参数见表1。
表1:檀香基因组测序基本情况
基因组ContigsN50达到4.3Mb——这是目前国内用单一测序技术获得的组装contigsN50长度最好的植物基因组图谱之一。研究团队相信,随着超长片段测序技术的攻克,未来必将可以获得更完美的基因组。
檀香基因组是CookGene“新一代基因组测序项目计划”的一部分。随着第四代测序技术Oxford
Nanopore的崛起,其超长的读长优势有助于我们高效快速获得高质量的基因组组装图谱,为打开基因组大门提供了钥匙。CookGene公司表示,将联合对基因组感兴趣诸多科学研究人员一起,陆续展开不同物种基因组图谱的构建。CookGene公司介绍,目前公司即将完成的基因组还包括几个禾本科植物和热带果树的基因组,这些基因组会在年底前陆续发布。
不同于其他机构将ONT测序称之为第三代测序技术,CookGene将之称为第四代测序技术,该团队认为ONT和PacBio虽然同属于单分子实时测序,但ONT测序采用电流信号变化检测序列信息,与PacBio边合成边测序从原理上有根本的区别,众所周知,边合成边测序技术最大受制因素是DNA聚合酶活性,目前世界上最好的DNA聚合酶测序平均长度也很难突破40Kb,ONT测序不需要考虑聚合酶的限制,测序长度几乎只受到DNA提取长度的影响。目前CookGene公司已研发出适用于ONT平台的超高质量DNA提取技术,测序产出达到国际领先水平,获得的序列中已经有部分序列长度超过了200Kb,并有望随着DNA提取技术的优化,获得更长读长的测序序列。该公司预估,在不久的将来其测序最大长度有望突破1Mb。
图2 高质量基因组DNA提取
图3 Nanopore测序读长与产量
参考资料:
1.https://www.ncbi.nlm.nih.gov/biosample/7690435
2. MECAT: fast mapping, error correction, and de novo assembly for single-molecule sequencing reads ,doi:10.1038/nmeth.4432