中国科学家领衔的国际团队完成世界首个兰花全基因组测序

经过多年的努力攻关,由国家兰科植物种质资源保护中心暨深圳市兰科植物保护研究中心刘仲健教授领衔的来自清华大学、台湾成功大学、中国科学院植物所、深圳华大基因研究院、华南农业大学林学院以及比利时根特大学等多个研究单位的研究团队完成了小兰屿蝴蝶兰基因组和分析,获得了首个兰花基因组全景图。小兰屿蝴蝶兰是一种广泛用于杂交育种的具有重要园艺价值的兰花, 该研究成果“The genome sequence of the orchid Phalaenopsis equestris”于2014年11月25日在线发表于国际顶级科学杂志Nature Genetics(自然遗传学),并将作为本期的封面文章(在线发布的文章链接http://dx.doi.org/10.1038/ng.3149)。

兰科植物(兰花)作为植物界种类最丰富的家族之一,是植物多样性保护的旗帜物种,素有“植物界大熊猫”之称。很多兰花具有独特的吸引昆虫完成传粉的机制,吸引了自达尔文以来无数的演化生物学家和植物学家对兰花进行大量细致的观察和研究。全世界大量的兰花爱好者也沉醉于这个至今仍不断有新物种发现的植物大家族。然而兰花生物多样性的遗传基础,一直是悬而未决的问题。全基因组测序技术的快速发展为我们提供了有力的研究手段。

该研究对小兰屿蝴蝶兰进行了全基因组测序和组装。在此基础上进行基因预测,一共发现了29,431个蛋白编码基因。有趣的是这些蛋白编码基因的平均内含子长度达到2,922碱基对,这一长度显著超过了迄今为止所有植物基因组中平均内含子长度,进一步分析发现蝴蝶兰内含子中的大量的转座元件是蝴蝶兰超长内含子的主要原因。

该研究搜索全基因组序列得到的342个同时涵盖其他七个单子叶和双子叶物种的单拷贝直系同源基因家族。基于这些基因家族进行演化时间推算的结果显示蝴蝶兰和其他单子叶植物的分歧时间为距今1.351±0.17亿年以前。另外,分析蝴蝶兰基因组中的重复基因间的同义替换率,发现蝴蝶兰在距今7,557(7,150-8,073)万年前也就是白垩纪古近纪交界前不久经历了一次全基因组重复, 这次古多倍化事件以及随后发生的兰科植物大规模辐射演化奠定了兰科植物发育成为被子植物第二大科的基础。

和水稻,拟兰芥等碳三代谢以及玉米高粱等碳四代谢植物相比,小兰屿蝴蝶兰属于景天酸代谢附生植物。景天酸代谢途径是对干旱或附生环境的一种适应性光合作用代谢途径。该代谢途径大大提高了植物对水的利用率。本研究是首次对景天酸代谢植物进行的全基因组测序。通过对景天酸代谢途径的六个关键基因家族的分析,发现其中四个基因家族在蝴蝶兰中发生了特异的基因重复和丢失。这些基因重复和丢失事件很可能与兰花中景天酸代谢途径的演化有重要贡献。

MADS-box基因家族是调控植物发育尤其是花的发育的重要基因。兰花尤其以它特殊的花形态著称。该研究分析了蝴蝶兰中的MADS-box基因家族的分布和演化,发现了多个在兰花中特异扩增和分化的几类MADS-box基因。这些兰花特有的MADS-box基因很可能对高度特化的兰花形态发育发挥重要作用。

“蝴蝶兰全基因组图谱”是世界上第一个完成测序和分析的兰科植物和景天酸代谢(CAM)植物的基因组图谱。它的完成填补了植物基因组研究的多个空白,对全球基因组科学作出了重大贡献,将为世界上其它相关研究提供全新的起点和平台。全世界的大量兰花由于非法采集和生境破坏而濒临灭绝。兰花基因组的公布将使得全基因组水平对濒危兰花多样性和演化进行探索和研究得以实现,为兰花保护提供重要的理论依据和指导。同时,兰花全基因组序列也将为兰花遗传工程育种研究提供重要资源和基础,对于加速兰科植物保护、兰花品种创新、推进兰花相关产业链的发展和提升我国在生物学、碳汇研究、生物多样性以及环境气候变迁等领域的研究水平具有重大的意义。

;