计算生物学所科研人员重构青藏高原人群的遗传起源和演化历史
8月26日,《美国人类遗传学杂志》(AJHG)在线发表了中国科学院上海生命科学研究院计算生物学研究所徐书华研究组的研究成果“Ancestral Origins and Genetic History of Tibetan Highlanders”。该项工作基于藏族人全基因组测序数据,参考全球200多个现代人群以及几个已灭绝的远古人类的遗传信息,运用和发展新的计算分析方法(ArchaicSeeker),解析了青藏高原人群的遗传背景,重构了高原人群的祖先起源、基因交流和演化历史,揭开了远古人类和现代人类征服青藏高原神秘面纱的一角。
是什么原因驱使人类祖先向全球各地迁移?又是什么力量召唤史前人类踏上青藏高原的征程?如今我们是否还能循着至今仍驻守高原的人群的热血(基因)追溯那些开拓者的足迹,感受人类祖先挑战生理极限、征服高原极端环境的勇气?长期以来,青藏高原人群的起源和演化历史,在人类学、考古学、语言学和进化生物学等许多领域都存在较大的争议。一些关键问题引起了广泛的思考、讨论和研究,但都没有定论。如(1)高原人群到底是什么人?与亚洲乃至全球其他人群有何亲缘关系?(2)人类何时进驻青藏高原?(3)最初进入青藏高原的是什么人?(4)早期人类是否都已灭绝?还是有基因传承?与现存藏族人群有何联系?(5)人类进入青藏高原的征程究竟是怎样一种曲折的历程?研究小组怀着对开拓者们无限的敬意和对他们留存后世演化至今的基因的敬畏,小心检测和分析了33位藏族人和5位夏尔巴人的基因组,探讨了关于青藏高原人群起源和演化的一系列关键问题。主要发现和结论可归结为以下五个方面。
(1)以藏族和夏尔巴为代表的青藏高原人群的遗传构成极其复杂,是高度遗传混合的族群。现存高原人群的基因组中可以鉴定出约90%左右的现代智人谱系(Homo sapiens sapiens)和6%左右的古人类谱系(Archaic Hominoid);其中现代智人谱系不同程度地源于多个已分化的人群,包括东亚、中亚和西伯利亚、南亚,以及西亚和大洋洲人群等;而古人类谱系的来源也很复杂,其中一些基因片段可能来源于阿尔泰尼安德特人(约1%)和丹尼索瓦人(约0.4%)或其近缘族群,而另一些基因片段可能源于一些不同于尼安德特人和丹尼索瓦人的其他早期智人或者甚至远古人类。在所研究的200多个全球现存人群中,东亚人群普遍比其他人群与青藏高原人群在遗传更近;与藏族和夏尔巴遗传上最近缘的族群是同处高原的土族、彝族和纳西族;而平原人群中,汉族是与藏族遗传最近的族群,两者共享的东亚遗传组分超过其遗传总体组成的80%;相应地,两个族群的祖先群体分化的时间大约是在9000—15000年前,这个时间似乎早于通常认为的东亚农业文明时间,但是从遗传学数据上看,汉族祖先群体从此期间开始发生显著的群体扩张,而高原人群却没有类似的迹象。
(2)基于遗传学数据的计算,青藏高原人群的遗传起源可追溯至4万年至6万年前。这个时间窗口属于人类演化史上的旧石器时代中晚期,这也意味着,人类在青藏高原的活动可前推至末次盛冰期(19000—26000年前)之前。
(3)早期进入青藏高原的人类不是一个单一的族群,甚至不是一个物种。他们最初也许不是青藏高原的永久性居民,很可能是一些采摘狩猎族群(Hunter-gatherer),只是到一定季节才到高原上采集或猎取食物。这些人类族群包括旧石器时代的现代智人——在遗传上与已灭绝的古西伯利亚现代智人有近缘关系,也有早期智人——可能有多个支系,包括考古学已经发现的阿尔泰尼安德特人和丹尼索瓦人,以及其他未知古人类。并且这些早期进入青藏高原的人类族群间发生了广泛的基因交流,形成了一个包含现代智人和早期智人多个谱系的遗传构成极其复杂的混合人群(文中称之为SUNDer)。
(4)青藏高原人类演化存在延续性。早期进入青藏高原的人类,或者文中称之为SUNDer的人群,虽然作为一个族群已经消亡,但是通过与后期进入青藏高原的族群遗传混合,其部分基因片段得以保存下来,从而使得青藏高原人类演化具有了延续性。当然,这些古人类基因片段,尤其是那些至今被大多数高原人群携带的古人类高频基因片段,得以传承的原因,可能正是因为这些基因片段能帮助人类适应高原环境。作为支持这个观点的证据,该项工作发现高原人群携带古人类片段的比例与人群所在的海拔高度呈现很强的正相关性。
(5)青藏高原是跨时空的人类族群“基因大熔炉”——青藏高原人群起源和演化历史的“混合之混合”模型。通过该项研究,可以初步勾画出人类开拓青藏高原漫长征程的一个总体轮廓。文中构建了一个两波“混合之混合”模型来说明这个演化历程。由于从基因组学数据中估算的时间节点与末次盛冰期(LGM)存在很大程度的关系,按此大致分为三个阶段。第一阶段,或称为末次盛冰期前阶段(Pre-LGM)。大约4—6万年前,青藏高原上已经活跃着旧石器时代人类的不同类群,包括早期智人的不同支系和现代智人的支系。这些类群经过在高原的长期暴露,经受了高原环境的选择,同时彼此之间发生了遗传混合(第一波混合),那些携带适应性基因变异的个体得以生存下来,并世代繁衍,逐渐形成了一个高度混合的族群SUNDer。第二阶段,或称为末次盛冰期后阶段(Post-LGM)。SUNDer经历了末次冰川盛冰期的考验,人口极度下降,但是并未灭绝,有少数后代留存。同时,盛冰期过后,大约在15000年前,新的移民再次开始移民青藏高原。SUNDer的后代与末次盛冰期后陆续到来的新的移民人群发生了基因交流(第二波混合)。第三阶段,大致在农业文明产生前后,这一阶段一直延续至今,与第二阶段可能没有明显的间断。但是随后农耕时代的到来引起平原地区人口的扩张,也许对移民青藏高原的浪潮起到了推波助澜的作用。期间现代人类陆续(也许比先前更大规模地)登陆高原,大部分是已经分化的人群,包括南亚人、东亚人、中亚和西伯利亚人等。但这些四面而来的新移民也许本身就是遗传上混杂的族群,他们的迁入,同时也为青藏高原人群引入了更为复杂的遗传构成。这期间,青藏高原人群也发生了不同程度的分化,比如藏族和夏尔巴人的祖先也许正是这个期间分道扬镳。当然,藏族人与夏尔巴人的祖先分开以后,两个族群也并未完全隔离,彼此之间可能一直存在基因交流。这也是为何藏族人和夏尔巴人如今看起来非常相似的原因。
不同人类族群之间的分化、隔离、再接触、再融合,这些过程交替发生、交织在一起,最终造就了现存的青藏高原人群。类似的过程,在全球其他区域也可能普遍存在,并贯穿整个人类演化历史始终。青藏高原人群的起源和演化历史,是整个欧亚大陆乃至全球人类的演化史研究中不可或缺的部分,对阐明人类遗传多样性产生和进化的机制研究也具有重要的参考价值和理论意义。
该工作由计算生物学研究所徐书华研究组的博士研究生鲁东胜、苑锴、王晓骥、王宇辰、张超、阳雄、邓恋、周楹、冯启迪,以及助理研究员楼海一博士、陆艳博士等共同完成。署名合作单位包括西藏民族大学、上海科技大学、复旦大学和中科院昆明动物研究所等。该项工作得到了中科院战略性先导科技专项(B类)、国家自然科学基金委和上海市科学技术委员会等多项基金的资助,同时得到国家遗传与发育协同创新中心支持。(计算生物学所)
以藏族和夏尔巴为代表的青藏高原人群起源和演化历史概略图
相关附件