基因组图谱全面揭秘鸟类演化“大爆炸”历程(鸟类、基因组、基因)

本报记者 华 凌 综合外电

为何鸟类没有牙齿;颜色鲜艳的羽毛如何演化;鳄鱼怎么会跟鸟类攀上亲戚;鹦鹉为何能“说”人话?

一项历时四年之久、雄心勃勃的国际合作研究,通过全面解析现代鸟类基因组图谱,使约6600万年前地球上庞大动物类群恐龙覆灭之后出现的鸟类演化“大爆炸”历程浮出水面,并深入解答了很多疑问。主导这项研究的国际鸟类基因组研究联盟不久前以专刊形式集中公布了28篇首期研究成果,其中8篇刊登在《科学》杂志鸟类专刊上,其余20篇陆续刊登于《基因组生物学》《大数据科学》等杂志,这些揭开了生物演化史上又一重要的篇章。

鸟纲基因组和演化生物学研究

以往的研究显示,在白垩纪物种大灭绝事件中幸存的鸟类,经历了一次快速的演化。然而,这一快速演化过程在此前一直是个谜,现代鸟类的演化关系困扰了生物学家数个世纪之久。另外,在物种大灭绝之后获得新生的鸟类如何演化出1万多个物种,其背后的生物多样性分子基础也知之甚少。

为了回答这些问题,中国深圳华大基因研究院国家基因库副主管张国捷研究员、美国杜克大学和霍华德休斯医学研究所神经生物学家埃里希·D·贾维斯、丹麦自然历史博物馆托马斯·吉尔伯特领导的国际鸟类基因组联盟,完成了48个鸟类物种的基因组测序、组装和全基因组比较分析,包括乌鸦、鸭、隼、鹦鹉、企鹅、朱?、啄木鸟、鹰等,囊括了现代鸟类的主要分支。

这些新发布的成果在许多鸟类演化相关问题上提出了新的观点。其中发表在《科学》杂志的两篇综合性文章称,研究人员基于全基因组数据构建了有史以来最高可信度的鸟类分子演化树,前所未有地解决了关于早期鸟类演化关系的历史争论;描述了鸟类基因组演化的历程,从基因组角度阐述了鸟类宏观演化的重要特征。

而刊登在《科学》杂志鸟类专刊上的6篇文章,分别阐述了控制声音学习的分子通路在一些鸟类和人类的大脑语言控制区域中独立演化过程、鸟类性染色体复杂的演化历程、鸟类在早期演化过程中是如何一步步丢失牙齿、鸟类近亲鳄鱼的基因组是怎样演化的、鸟类歌唱行为在大脑内的基因调控机制,以及一种利用大规模基因组数据构建演化树的新方法。

清晰绘制鸟类家族关系树

以往生物学家利用部分DNA测序、解剖学或行为学的特征均无法构建出明确的鸟类家族树。研究人员解释说,由于现代鸟类在早期快速形成物种,扩张的时间很短,物种间单个基因的水平上没有演化出足够多的序列差异,因此仅用少量的DNA序列很难提供足够的信号确定物种间的亲缘关系。另外,由于许多物种可以演化出类似的形态或行为,这为利用解剖学和行为学特征进行物种树构建制造了许多障碍。

为了解决现代鸟类分化时间及其之间关系的问题,研究人员决定采用全基因组DNA序列来推断鸟类物种树。通过全基因组数据的方法推断出的鸟类物种树发展史,与之前得到的结果有巨大差异。研究发现,单纯使用编码蛋白基因来构建演化树与真实物种树具有极大的差异,因此还需要利用非编码序列,包括基因间区。研究还发现,编码蛋白序列在一些具有相似生活史的物种之间存在有意思的趋同演化现象。

新的鸟类物种树彻底解决了今颚总目(新鸟),即鸟类主干的早期分支问题,还对一些长期争议的关系给以确切的结论。比如,新的研究结果支持水生鸟类有3次独立起源;主要陆生鸟类如鸣鸟、鹦鹉、啄木鸟、猫头鹰、鹰和隼等都来自同一祖先——顶级的捕食者,这类生物同时也是一种曾生存于美洲的巨型恐怖鸟(又称骇鸟)的祖先。

研究人员表示,基因组测序技术的日渐成熟和成本下降,以及构建演化树计算方法和比较基因组学(comparative genomics)等的发展,使得他们能比过去更好地解决这些科研难题。

由于每个物种约有1.4万个同源基因,鉴于这一数据集的庞大和分析的复杂性,研究人员采用了几个新的方法来构建鸟类演化树。研究人员称,构建鸟类物种树一次计算大约一个CPU要跑300年才能完成,因此这是一次前所未有的大数据分析的计算挑战。其中一些分析甚至需要太字节内存的超级计算机。

更新鸟类演化的诸多论断

全基因组分析的结果推翻以前的一些研究结论。此前研究推测现代鸟类的大爆发发生在6600万年前大灭绝事件之前的1000万年至8000万年左右。然而新的分析表明,现代鸟类的爆发应该发生在白垩纪物种大灭绝之后1000—1500万年以内,虽然这一时期覆灭了地球上几乎所有的恐龙,部分鸟类却存活下来。

基于新的基因组数据,研究人员认为,仅有很少的鸟类幸免于大灭绝事件。后来,它们突发性的演化出1万多种新鸟纲物种。预计现存95%的鸟类的祖先均起源于这一时期。研究人员推测大灭绝事件之后原本由恐龙所占据的生态位被鸟类所占据,新的生态环境为鸟类新物种形成创造了良好条件,导致它们在不到1500万年的时间快速产生很多新物种,在很大程度上也解释了为何现代鸟类具有如此丰富的多样性。

让人惊异的是,相比其它脊椎动物(vertebrates),鸟类基因组具有极其特别的特征。张国捷及其学生李彩研究发现,与其它爬行动物相比,鸟类基因组中重复序列的含量比较少,并且在鸟类祖先从爬行动物中分化出来后丢失了数千个基因。

张国捷说:“鸟类丢失的很多基因对于人类都有很重要的功能,在维持如生殖系统(reproductive system)、骨骼生成和肺部系统等方面不可或缺。这些关键基因的丢失对于鸟类许多特有表型的演化可能有举足轻重的影响。这是个非常有趣的发现,通常认为的演化过程中产生的新性状和表现一般是新产生的遗传物质的产物,然而鸟类独特的演化过程提供了很特殊的例子,说明基因的丢失也能引发出新表型。”

研究人员还发现,从整个染色体水平到基因顺序,鸟类的基因组结构在过去1亿多年的时间内非常稳定。与哺乳动物(mammal;mammalian)相比,鸟类的基因演化速率也很慢。这是鸟类在超长时间跨度下,在基因组水平上展示出的特有宏观演化特征。

然而,一些具有相似生活习性或表型的鸟类,如具有鸣唱学习能力的鸣禽,它们的部分基因组区域表现出极其快速的演化速率。这种情况称为趋同演化,可能是一些亲缘关系很远的鸟类独立演化出相同表型的潜在机制。

鸟类物种多样性的分子基础

鸟类为何可以鸣唱?研究表明,鸣唱学习在鸟类中至少独立演化产生了两次,并且与很多基因的趋同演化相关。发表在《科学》杂志上的一篇文章提出,具有鸣唱学习能力的鸟类,包括黄莺、鹦鹉和蜂鸟,大脑中与鸣唱学习相关的脑基因调控回路,跟人脑中语言相关的区域呈现出趋同表达和演化的特征。研究发现,有50多个相关基因在上述区域表现出相似的变化模式,且这些基因很多与神经联结的形成有关。另一篇《科学》杂志上的文章则认为,全基因组10%的基因参与了鸟类的鸣唱。这些基因在大脑中与鸣唱学习相关的不同区域有着不同的激活方式,而且它们的激活还通过表观遗传进行调节。此外,一项发表在《公共科学图书馆·综合》杂志上的研究称,鹦鹉具有一套独特的鸣唱学习系统,其中还会嵌套另一个鸣唱学习系统,这也许是其具有模仿人类语言强大能力的原因。而另一篇发表在《BMC基因组学》杂志上的研究则揭示了鸣禽大脑中与鸣唱控制相关的物种特异性基因。

鸟类的性染色体有何特别之处?正如人类的性别由X染色体和Y染色体控制一样,鸟类的性别由Z染色体和W染色体控制。发表在《科学》杂志的一项研究中提出,半数以上鸟类的W染色体仍然包含大量的功能基因。这极大地颠覆了之前所认为的鸟类W染色体和人类Y染色体一样都是“基因坟墓”的传统观点。该项研究还发现,不同鸟类的性染色体处于截然不同的演化状态。如鸟类家族中相对古老的鸵鸟和鸸鹋,它们的性染色体跟祖先状态非常相似,大部分基因是有功能的;而一些现代鸟类,如家鸡和斑马雀的性染色体则只包含少数的功能基因。

鸟类为何没有牙齿?生物学家早就发现,鸟类有砂囊却没有牙齿。发表在《科学》杂志的一篇文章指出,与其它一些有齿类的脊椎动物(vertebrates)不同,在现存鸟类中,与牙釉质、牙本质和牙齿的构建块相关的部分基因发生了关键的基因突变。研究表明,在大约1亿多年以前,鸟类共同的祖先在很短的时间内已经失去了5个与牙齿相关的基因的功能,从而导致鸟类没有了牙齿。

鸟类和恐龙有何等关联?与哺乳动物(mammal;mammalian)不同,鸟类具有大量的小染色体,这些小且富含基因的染色体被认为存在于它们的恐龙祖先中。在一项发表在《BMC基因组学》杂志的关于基因核型结构的研究中,研究人员分析了家鸡、火鸡、北京鸭、斑马雀和虎皮鹦鹉的全基因组。结果发现,家鸡具有相对较少的染色体结构变异。

鸟类最近的亲戚是谁?发表在《科学》杂志上的一项研究,对与鸟类关系最近的亲戚——鳄鱼进行了基因组研究,结果发现,鳄鱼基因组是演化速率最慢的基因组之一。根据鸟类和鳄鱼的基因组,研究人员推断出鸟类和鳄鱼共同祖先的基因组序列。而这个“祖先”也是鸟类和那些在6600万年前就已经灭绝了的恐龙的共同祖先。

基因树和物种树的差异重要吗?研究发现,没有任何一个由单个基因构建出来的演化树与物种树完全一致。导致这种情况的部分原因,是由于一种叫做不完全谱系分选的过程造成的,即由于物种分化时间极其短,使得祖先基因的多态性在分化的物种里随机的固定下来。这种现象也为构建系统演化树带来了极大的障碍。为解决此问题,研究人员采取了一种新的计算方法,提出基于溯祖理论利用综合的基因树来推断全基因组水平的物种树。

鸟类基因组携带的病毒序列比其他物种少吗?哺乳动物(mammal;mammalian)基因组拥有大量过去病毒感染后插入宿主基因组中留下的DNA“化石”,被称作“内源性病毒元素”。发表在《基因组生物学》杂志上的一项研究称,鸟类的内源性病毒元素数量比哺乳动物(mammal;mammalian)少6—13倍。这也与鸟类基因组比较小的事实相符合,并暗示着两种可能性:要么是鸟类基因组更不容易被病毒入侵,要么是鸟类能更好地清除入侵的病毒序列。

艳丽羽毛是怎样演化出来的?精致鲜艳的羽毛在鸟类演化上具有重要意义,羽毛漂亮的雄鸟在求偶过程中会比竞争对手更具有优势。在前面提到的一篇《科学》杂志的综合性文章中,研究人员称,在鸟类46个家族中有8个家族,其与羽毛颜色相关的基因角蛋白等要比其他基因演化得更快。而一项发表在《BMC演化生物学》杂志上的研究称,水禽具有最少的β角蛋白基因,在陆地鸟类该基因则多出两倍以上,而在家养宠物和农业鸟类中该基因数量则更多,高达8倍以上。

当鸟类面临灭绝,或者从濒临灭绝中恢复过来时会发生什么?在一项发表在《基因生物学》杂志上的研究中,研究人员分析了包括亚洲朱?和美洲白头海雕在内的多个濒危鸟类的基因组,发现这些濒临灭绝的鸟类体内,降解环境毒素的基因有着较高突变率,同时与免疫系统(immune system)相关的基因具有更少的多样性。在一个近年来才逐渐恢复多态性的朱?种群中,与大脑功能和新陈代谢相关的基因具有更快的演化速率。研究人员还发现,这一种群中的基因多样性比预期要多,这为后续的朱?种群保护带来了更多希望。

继往开来谱写重要篇章

鸟类基因组图谱项目的开展,获得了全世界各地博物馆和其他机构研究人员的支持。在过去30年中,他们所收集的冻存鸟类组织样本,为获取DNA样品提供了极大的便利。同时,鸟类基因组联盟建立了各种数据库,以便其他研究人员对鸟类各种复杂性状的遗传基础进行深入的研究。

建立一套大规模基因组研究的流程是一项庞大的工作,包括收集和整理组织样本、提取DNA、分析样品质量、测序及管理大量的新数据。研究人员相信,这些工作将为其他在做脊椎动物(vertebrates)大规模测序(Large-scale sequencing)的研究团队提供重要借鉴。为了鼓励其他研究人员从这些“大数据”中挖掘出更多的信息,以及发现以往小规模数据很难观察到的数据特征,鸟类基因组联盟已将整个项目得到的全部数据公布在GigaScience、NCBI、ENSEMBL和CoGe这些数据库上,对外开放并允许下载。

其实,为了更好地利用这个项目产生的数据,研究团队在项目早期就已经将未发表的数据开放给同行以开展相关研究。在2014年年初,他们把课题所有基因组数据公布在GigaScience上,并通过推特进行推广,在社交媒体上引起了巨大反响和热烈讨论,短时间内使得该数据库的用户量增加了一倍。

“物种从何而来,如何演化,如何发展,是生物演化研究中最基础的问题。基因组的应用使我们得以重现历史,回答了这些最根本的科学问题。这是迄今为止对同一类群物种最大规模的基因组演化历程分析,也是利用比较基因组学(comparative genomics)揭示生物宏观演化历史的重要一步。”张国捷说。

吉尔伯特认为:“虽然不断有许多脊椎动物(vertebrates)基因组发布,但目前还没有一项研究对某一大类的脊椎物种的生物多样性开展如此详细的专项分析。揭示生物多样性的分子基础正是组织这一联盟的初衷。只有在足够大样本量的前提下,研究人员才能完整开发出包括整个脊椎动物(vertebrates)群在内的基因组多样性。”

埃里希·D·贾维斯说:“这是历史性的一刻。随着样本量的扩大,基因组数据的增多,越来越多的关键问题可以被回答。我参与到这个项目中,是因为本人长期以来一直把鸟类作为研究人类发声和语言学习的模型。这些鸟类的起源为在大脑演化方面的研究开辟了许多全新的视角。”(原标题:缤纷羽翼、悦耳鸣啼、盘旋翱翔,还有与时迁徙……基因组图谱全面揭秘鸟类演化“大爆炸”历程)

;