组学重建真菌现有分类系统

研究背景

真菌是地球上最大、丰富度最高的生物之一,估计有150万到500万个物种,目前UNITE 数据库中有ITS序列的真菌物种为 73,929 个。

https://unite.ut.ee/

目前具有全基因组数据的物种大约有400个,它们的基因组大小从2M-180M不等。目前真菌界的物种进化关系主要是基因树建立的,人们通常会选几个蛋白质编码基因或者DNA片段进行多序列比对,然后进行系统发育树的构建。例如2006年美国密歇根大学Tim教授用了6个基因(18S, 28S, 5.8S, EF1a 以及 RPB1 和 RPB2)对真菌高阶分类单元进行了重建。这也是目前真菌界比较稳定的系统发育树,如下图。

然而在物种进化过程中,由于其编码的每个基因收到的进化选择压力不同,比如有的非常重要的功能基因突变会导致物种死亡等,所以这类基因相对非常保守,进化速度慢,而有部分基因不编码重要的生理功能受的进化选择压力较小,从而进化速度较快。所以物种树是不能用基因树完全替代的,在以前基因组测序贵,可用数据较少的情况下用多基因树进行系统发育重建是一个很好的方向。随着真菌全基因组数据越来越多,研究者们开始尝试用不用的方法构建全基因组系统发育树如composition vector(CV) 等。

本文中,作者把两个不同的物种比喻成两本不同的书,基因树就像是用书中的一些相似的段落来判断这两本书是不是一样,而作者开发的全基因组建树的方法就是考虑从整本书的角度来全面比较两本书之间的关系,并给出更为合理的进化关系。作者开发了一种叫Feature Frequency Profile (FFP) 的方法进行全基因组树的构建。作者目标主要是a. 重新审视由基因树主导的物种进化分支关系;b.让大家争论目前用基因树进行进化模型分析的利弊并与全基因组树进行比较。

主要结果:

作者分别用已发表的全基因组数据;转录组数据以及蛋白质组数据分别建树进行比较,发现用蛋白质组数据建的树数,拓扑结构最稳定,作者用蛋白质组数据建的树分别与基因树进行了一系列比较。接下来作者给出了一些非常颠覆性的结论:

以前我们通常认为真菌界有4-8个主要的门,包括(Glomeromycota, Zygomycota, Basidiomycota, Ascomycota, Chytridiomycota, Neocallimatigomycota, Blastocladiomycota, and Microsporidia)。而作者通过蛋白质组树将真菌界减少到3个类群,第一类是终生不产生双核的单核真菌:Cryptomycota, Chytridomycota, and Zygomycota。第二类是有性生殖产生担孢子的担子菌门包括: Puccinomycotina, Ustilaginomycotina, and Agaricomycotina。第三类是有性生殖产生子囊孢子的子囊菌门,包括:Taphrinomycotina, Saccharomycotina, and Pezizomycotina。作者认为这三个门是所有真菌的共同祖先

在基因树中位于所有真菌基部位置的Microsporidia,在蛋白树中被分到了非真菌的单细胞真核生物中。蛋白树显示Microsporidia的蛋白组数据与原生动物更为相似,而不是真菌。

另一个重要的调整是把Neocallimastigomycota成真菌界换到了原生动物界,而且本文还调整了Wallemia等菌的分类位置。

总结

本文在真菌高阶分类单元重建了现有的分类系统,虽然本文才刚刚发表还未有人引用,但可以预见本文在真菌分类进化领域的引领性作用,随着测序越来越便宜,以及生物信息学技术的发展,未来用组学数据进行进化及系统发育分析将取代基于单个或者多个基因进行系统演化方法,让大家从管中窥豹时代进入纵览全局时代。

Reference

https://unite.ut.ee/

Choi J J, Kim S H. A genome Tree of Life for theFungi kingdom[J]. Proceedings of the National Academy of Sciences, 2017, 114(35):9391-9396.

James T Y, Kauff F, Schoch C L, et al.Reconstructing the early evolution of Fungi using a six-gene phylogeny[J].Nature, 2006, 443(7113): 818.

;