基因的力量:一次北欧生命科学考察


鸟类如何成为白垩纪大灭绝的幸存者?DNA如何揭示人类的历史?个体化医疗能否攻克不治之症?新的基因技术正不断拓展认知领域,也改变着我们的生活方式。

博物馆中的进化论

丹麦首都哥本哈根最著名的景点就是看海边的美人鱼像。但是有另外一个地方,常常被忽略,却能令人大开眼界。这就是丹麦的自然历史博物馆。这座博物馆包括了三个分馆:动物博物馆、地质博物馆和植物博物馆。最有特色、藏品最出众的,当属动物博物馆。

动物博物馆的中心是一副巨型的梁龙骨架,它有17米长,超过10米高,是世界上保存最完整的6具恐龙化石之一,其40%的骨架都是由原始化石组成。这个比例在所有博物馆藏品中是最高的。2009年,古生物学家莱蒙德的儿子,在美国怀俄明州的采石场发现了此具梁龙骨架。骨架被挖掘出之后在鹿特丹被修复组合,并进入拍卖市场。丹麦自然历史博物馆以超过650万美元的巨资买了下来,成为博物馆的标志性展品。

博物馆的另一大特色是对鲸骨骼标本的收藏。丹麦地处北欧门户,世界第一大岛——格陵兰岛在其管辖之内,鲸资源非常丰富。经常有鲸搁浅于格陵兰的海滩上,因此丹麦科学家有更多的机会取得这些庞然大物的标本。展馆中就陈列有蓝鲸骨骼标本,全长十几米,头骨有铲车那么大。鲸的心脏就像一口巨大的钟,挂在充满保存液的玻璃缸中展出。其实,被展出的蓝鲸骨骼在其家族中只能算是普通身材。作为地球最大的生物,其身长可以达到30余米。我们在博物馆的仓库里就看到了更大的蓝鲸骨骼,像一列小火车。

丹麦动物博物馆展示了许多特有的极地物种,如北极熊、驯鹿、麝牛,还有复原的猛犸等等。科学家们并非简单陈列,而是力图以进化论的体系与逻辑构建展览。比如在鲸的展室中,还展室了牛、羊等偶蹄类动物。达尔文在环游世界时,已经知道鲸并不是鱼而是哺乳动物,但他并不知道是哪些哺乳动物进入海洋后,演化成了鲸,也就是说鲸的进化路径并不清楚。这个问题也困扰了生物学家许多年。

直到近些年基因测序技术大规模使用后,科学家们通过对基因的研究和比对后才发现,我们最常见的牛羊等偶蹄类动物,和鲸有相近的亲缘关系。它们是鲸的近亲。后来在孟加拉发掘出一种古生物化石,通过对化石DNA的提取和测序,它被认为是鲸的进入大海的祖先。这个我们从没见过的远古生物也被丹麦科学家们复原出来,做成了模型:它就像一只狼,但没有了耳朵,有着锋利的牙齿,身体更具流线型,手脚都长出了蹼,而尾巴则像蜥蜴。

华大基因为丹麦动物博物馆的科学家们提供了技术支持。合作主要在生物多样性方面,包括鸽子基因组、蚂蚁基因组、社会动物行为遗传的研究等,发表了一系列的文章。至今最突出的成果,是2014年在《科学》上以专刊形式发表的鸟类基因组系统演化史项目,该项目彻底解决了现代鸟类起源和演化的历史争议,是演化生物学的一次重大飞跃。

“物种从何而来、如何演化、如何发展,是生物演化研究中最基础的问题。基因组的应用使我们得以重现历史,回答这些最根本的科学问题。”华大基因科学家张国捷说,“这是迄今为止对同一类群物种最大规模的基因组演化历程分析,也是我们利用比较基因组学揭示生物宏观演化历史的重要一步。”

Jon Fjelds?教授是张国捷在丹麦动物博物馆的合作伙伴。Jon留着长长的胡子,与达尔文有几分相似。他不仅是一名出众的生物学家,也是一名画家——为各种鸟类画插图。这些精美插图被应用于《科学》杂志上。在他庞大的标本仓库中,最重要的收藏是一只渡渡鸟的头骨和完整的内脏标本。渡渡鸟早已灭绝,世界上只有两处博物馆保存着渡渡鸟化石。

Jon向我们解释,鸟类是白垩纪物种大灭绝事件中的幸存者,其后它们在短期内经历了一次超级物种大爆发。然而,现代鸟类的演化历史和亲缘关系,这一最基本的问题却是困扰了学界数世纪的未解之谜。另外,鸟类快速演化形成了超过1万个不同物种,产生这些鸟类生物多样性背后的分子机制也知之甚少。

为了回答这些问题,华大基因与众多科学家组成的国际鸟类基因组联盟,共同完成了48只鸟类物种的基因组测序、组装和全基因组比较分析。这48只鸟包括乌鸦、鸭、隼、鹦鹉、企鹅、朱鹮、啄木鸟、鹰等,囊括了现代鸟类的主要分支。

之前所有试图重建鸟类演化树的努力,无论是用部分DNA测序,还是使用解剖学、行为学的特征都遇到很多的困难,所得到的演化树之间充满矛盾。研究人员表示,现代鸟类在早期发生了快速的物种形成大爆发,因为这一快速扩张的时间很短,没有演化出足够多的序列差异,因此很难区分早期分支的亲缘关系。为了估计鸟类之间的关系图谱和分化时间,研究人员决定采用全基因组的信息来构建鸟类的物种演化树。

作为研究重要成果,这棵新的鸟类演化树彻底解决了鸟类的早期分支问题,还对一些旷日持久的相关争议给出了确切的答案。比如,新发现确认了水生鸟类有三次独立的起源;主要的陆生鸟类如鸣鸟、鹦鹉、啄木鸟、猫头鹰、鹰、隼等都来自同一祖先;这种祖先的鸟类是顶级的捕食者,它同时也是一种在美洲已灭绝的巨型恐鸟的祖先。

全基因组分析结果提示,现代鸟类的扩张发生在6600万年前的大灭绝事件前后。这次物种大灭绝事件杀死了地球上的所有恐龙,只有部分鸟类存活了下来。之前的一些研究推测现代鸟类的扩张应该发生在大灭绝事件之前的1000万年到8000万年,而全基因组分析的结果推翻了之前的结论。

基于这些基因组数据,研究者认为仅有很少的鸟类从大灭绝事件中存活了下来。后来这些鸟类逐渐演化出了1万多种新鸟纲(Neoaves)鸟类,95%的现存鸟类来自这一新鸟纲鸟类。大灭绝事件释放的环境也许为鸟类新物种的形成创造了良好条件,导致它们在不到1500万年的时间里快速产生了很多新物种,在很大程度上也解释了为何现代鸟类具有如此丰富的多样性。

基因组测序技术日渐成熟、成本下降,以及构建演化树计算方法和比较基因组学等领域的发展,这些条件使研究人员能更好地解决这些科研难题。

2015年6月,研究项目进一步扩展到所有鸟类,启动了“万种鸟类基因组”项目,预期在5年内建构1.05万种现生鸟类的基因组图谱,实现对鸟类生命之树的数字化重建。这是国际上首次对同一大类群的所有现生物种进行完整的基因组研究。

用基因组研究历史

哥本哈根大学的艾斯克(Eske Willerslev)教授是丹麦的学术明星,在电视上经常能看到他的演讲或对他的采访。他是大学地质遗传研究中心的主任,研究方向是古DNA和生物演化。如果说历史学家只能讲述最近四五千年的故事,考古学家的视野再远一些,可以描述一两万年前的状况,那么作为古DNA研究者,艾斯克将目光深入到几十万年前的生物世界。他最古老的一份研究样本取自70万年前一具被冰封的古马骨骼。

艾斯克的办公室里贴着一张2010年《自然》杂志的封面海报。封面文章是他与华大基因的合作成果,他们完成了世界上首个古人类基因组项目。从格陵兰岛上4000多年前萨卡克(Saqqaq)文明的一个古人类的头发中,艾斯克提取出细胞核DNA碎片,做出了世界首例古人类全基因组的深度序列测定和解读。这篇文章引起了巨大反响。

他对于古DNA的研究始于1999年。“最开始的时候为了获得古DNA,我们在北极地区打冰柱,研究冰柱里面的DNA序列。”艾斯克说,“通过冰柱不仅可以获得植物的DNA,还有各种微生物DNA,偶尔也能发现动物DNA。”这一学科可以研究古代环境的变化如何对生物体产生影响。很长时期以来,科学家们只能通过化石标本的外形来判断标本是什么物种,对多数残缺的样品而言,推测往往很困难。植物的化石可以保存得比较完整一点,但是动物的化石保存下来非常困难。

2010年之后,由于新基因测序技术获得重要发展,艾斯克发现许多研究工作可以借助基因测序取得突破,让想象成为可能。其中就包括关于格陵兰岛原住民的迁徙问题,他们究竟是来自亚洲还是来自欧洲?这个问题争论了很多年。

艾斯克此前在格陵兰岛发现了一个古人头发的样品。“当时我和华大基因的同行讨论后,决定用新的测序技术来研究这一样品,但是那时候很多人觉得这是不可能的工作。因为在古样品里,受到的污染非常严重,样品里会有很多的微生物污染,所以绝大部分的样品里都是微生物的DNA,不可能拿到人的DNA。”艾斯克说。

在古DNA研究里有两个很重要的挑战,一个是微生物污染问题,另一个就是在制备DNA样品时,绝对要避免引入现代人的DNA。因为人在操作样品过程中,实验者可能会把自身的DNA混杂进去。此前发表过很多人类古DNA的文章,但后来发现许多都是现代人的污染,而不是一个真实的古人DNA。“所以我们开发了一个新技术,叫DNA指纹技术,可以实时检测在整个实验中DNA的变化过程,以防止在实验操作过程中,会有现代人的样品和环境微生物DNA混杂进来,这个技术本身就是一个重要的突破。”艾斯克解释说。

另一个问题是,此之前的古DNA研究仅能得到200个左右碱基长度的DNA序列。但实际上如此少的DNA片段,没有办法告诉我们太多的有用信息。现在通过新的测序技术,我们可以一下子研究整个基因组序列。

经过反复尝试,艾斯克和华大团队通过各种方法的改进,最后终于获取到了格陵兰古人的DNA样品。所以这篇文章发表后引起了很大的轰动,是当时全世界第一个最完整的古人全基因组序列。“也就是说我们可以像研究现代人DNA序列一样,来研究古代人DNA序列。这样就有了可比性。例如我们可以搞清楚,在人类的迁徙过程基因交流有怎样的变化。这是一个重要的技术性突破,有了这个技术之后我们就可以攻克很多有趣的难题。”艾斯克说。

他很快又将这一研究方法扩展到大洋洲,希望搞清楚大洋洲古人类的缘起。他们是从非洲直接迁徙过来的,还是来自东亚?他通过对一个大洋洲古人的毛发获得了首个大洋洲古人的全基因组序列。再通过与其他人类群体比较后发现,大洋洲古人包含了非洲和亚洲两个族源,此前两种假说都成立。

另一项研究是关于欧洲人的演化历程——到底是先于亚洲人,还是后于亚洲人?同样,亚洲人的演化过程,与美洲人是否同步,还是先有亚洲人,再有美洲人?通过基因测序及比对,他们发现早期人类迁徙是一个很快速的过程,当人类祖先走出非洲后,很快就分布到了全球各个区域。艾斯克团队最近发表了一篇文章,研究了100多个青铜时代的古代欧洲人的DNA样品,发现在那时期的欧洲人群里已经有了非常大的多样性,甚至已经有中东地区的人群混杂在当时欧洲人中,说明当时人群迁徙如同今天一样,是很频繁的现象,这是超乎意外的发现。

在动物演化方面,艾斯克对马骨骼化石碎片进行了基因组测序。这副化石深埋于加拿大育空领地蓟溪遗址(Thistle Creek)古老的永久冻土层,有70万年的历史,是目前世界上最古老的可以获得基因组序列的样品。这项研究为包括远古人类在内的诸多已灭绝物种的基因组图谱绘制奠定了重要的遗传学基础。2014年为华大基因启动的北极熊基因组测序研究项目提供了珍贵的北极熊群体样品,该研究以封面故事发表在《细胞》杂志上,揭示了北极熊适应北极极地气候之谜。

艾斯克团队最近的一项工作,是通过古DNA研究导致病原菌的演化过程。他们在古人的牙齿里发现许多微生物,其中有很多是病菌或者病毒。通过跟现代病毒的比较,可以完整地看到这种病毒不断变化的过程。

黑死病曾是人类的噩梦,在历史上多次爆发。但是在更远更古老的人类样品里,他们也发现了这些病菌的存在。因此,这些病毒并非只是在中世纪爆发时才开始产生,在远古时代就已经存在了。通过古DNA的技术,还可以揭开病毒或者细菌的逐渐演化的过程。“有一些病毒早先时候非常致命,人一旦被感染,就会很快死去。但是宿主没有了,对病毒的繁殖和扩散也不是有利现象,会导致病毒的灭绝。”艾斯克解释说,“慢慢地,在历史演化过程中,病毒本身也在不断地演化,演化产生一些变异,能够使人更好地耐受,直到它传播给其他个体后,之前的宿主才会死。”于是通过对古代病毒和现代病毒序列的比较,以及古今人类基因组变化的规律,就可以看到宿主和病毒有共同变化的趋势,这对研究现代病毒的变异也很有借鉴意义。

个体化医疗

Jan Staffan Normark先生曾担任诺贝尔生理学或医学奖评委会秘书长,他也是一位著名的遗传学家。每年给获奖者打电话,通知获奖的消息,是Staffan的一项重要工作。由于时差原因,获奖者不一定能第一时间接到电话。但为了公正性,委员会必须尽快通知获奖科学家。所以每到这个时候,Staffan就会为自己准备一些零食,一边打电话一边消磨时间。在办公室里,评委们都会有一张正襟危坐的画像,而Staffan的画像则是跷着二郎腿吃零食的形象。

Staffan告诉我们,诺贝尔奖的评奖有两个标准:第一是新的发现;第二是对新发现的价值认定。有的成果很快就被认为极具价值,而另一些则过了多年之后才重获认可。这也能解释为什么在青蒿素发现30多年后,屠呦呦才走上诺奖的领奖台。

如果把时间轴拉长到最近半个多世纪,不难发现,诺贝尔生理学或医学奖的“价值”,始终围绕着以基因研究为重心的遗传学领域。迄今为止,只有四人曾经两度获得诺贝尔奖,而其中就有两人是因为遗传学领域的发现而得奖。弗雷德·桑格两度获得诺贝尔化学奖,莱纳斯·鲍林获得化学奖及和平奖。这项诺贝尔奖得主的名单就像一份遗传学发展史的名人录:摩根、缪勒、比德尔、泰特姆、克里克、沃森、威尔金斯、尼伦伯格、莫诺、史密斯、巴尔的摩,还有科恩。

如同两获诺奖的英国生化学家桑格所说:“从1943年开始,(基因测序)这个主题就成了我的研究重心,这源于这项工作固有的魅力和我自身的信念,因为我深信测序对理解生命物质非常重要。”

目前最受诺奖青睐的领域当属个体化医疗,仍旧与基因研究密切相关。

个体化医疗,又称药物基因组学,也就是说药物是根据患者的基因组定制的。目前,大多数药物要么适合所有人服用,要么谁都不能用。参与药物测试的患者都是随机选取的,只有测试结果显示该药物在大规模样本中安全有效,才能投放市场。

药物基因组学有望改变这一状况。不同药物的代谢方式受到遗传因素的影响,随着科学家逐步解读出这些因素,医生应该有可能在将来据此为患者开药。基因检测结果应该能够帮助医生预见哪些病人对哪类特定的药物反应最好。此外,它还可以指引医生避开会使特定DNA患者产生不良反应的药物,从而让治疗变得更加安全。

瑞典卡罗林斯卡医学院的研究员贺兵博士,正在与华大基因合作,通过全基因测序的方法去研究糖尿病肾病的遗传因素。他毕业于武汉大学医学院,1998年获瑞典卡罗林斯卡医学院博士。糖尿病是一种世界范围内的严重疾病,很多糖尿病患者会导向肾病,并引发肾衰竭。“这状况可能由多种因素所致,但有明确的遗传倾向。例如并非所有糖尿病人都会发生肾病,有家族史的危险倍增。”贺兵说。

他的团队正在从世界上一型糖尿病发病最高的芬兰,收集了近90对兄弟/姊妹家庭的DNA样品:二者均患糖尿病,但只一人有肾病,另一人无肾病为对照。DNA样品由华大基因完成全基因组测序,以及序列结果的前期质控分析和处理。目前重点分析蛋白编码区以及相关的调控区的突变,初步的发现将进行第二轮更大样品量(2500病人和3000对照)的统计学证实。最可能的致病突变进一步引入糖尿病小鼠的基因组,在动物实验上最后证实是否发生类似人的肾病。目前贺兵的研究正在密切观察小鼠的肾脏变化。如果能够找到糖尿病肾病的基因,则可以对相关人群进行检查和早期干预,并研制针对性的药物。

借助基因研究,人类对于糖尿病已经有了许多新的认识。在哥本哈根大学,我们见到了Torben Hansen教授,他也是诺和诺德基础代谢研究中心代谢基因组学的负责人。Torben的一项主要课题便是针对糖尿病的遗传基因研究。

格陵兰的因纽特人是Torben的研究对象。“因纽特人的肥胖比率很高,但是他们虽然胖,却很少有肥胖症,健康指标也是正常的,糖尿病的发病率也不高。”他采集了大量因纽特人的DNA样本做测序,发现一个蛋白质的表达对糖尿病形成有重要影响。“如果父母双方特定基因有突变,不能正常表达这个蛋白质,就很容易患糖尿病。如果双方都没有突变,或者仅一方有,虽然肥胖,但是得肥胖症、糖尿病的可能性就低。”Torben说,“这就是为什么格陵兰人只有15%的糖尿病发病率。”

他的另一项成果是针对单基因糖尿病的研究。研究人员在糖尿病患者人群中发现了一种特殊的糖尿病类型——单基因糖尿病,它不属于通常所说的一型或二型糖尿病,但往往会被误诊为后者。而对于单基因糖尿病患者施用胰岛素通常起不到治疗效果,有些甚至会加重病情或引起其他器官损伤。Torben教授与华大基因一起通过三年多的合作研究,现在已经开发出应用基因芯片筛查的方法诊断区分单基因糖尿病,价格只有300美元。目前已有上万个丹麦糖尿病患者使用次芯片进行筛查,调整治疗方案。

Torben团队还研究了妊娠糖尿病的问题。许多孕妇在怀孕期间患上糖尿病,但生完孩子后会好转。Torben用10年的时间跟踪研究了380名妊娠糖尿病患者,发现11%的女性在生育完后依然患有糖尿病。结合单基因糖尿病的芯片检测,他发现这些依然患有糖尿病的妇女中大多有这18个基因突变中的部分突变,这些突变大大增加了妊娠糖尿病患者后期患上糖尿病的风险概率。如果孕妇事先对自己的基因状况有了解,就可以进行适当的风险控制和干预措施。

2001年,临近人类基因组第一个草图公布的时候,人类基因组计划负责人弗朗西斯·柯林斯(Francis Collins)描述了对人类基因组前景的设想。他预测,到2010年,科学家将能够解读基因如何影响几十种常见病,如乳腺癌和心脏疾病等,为预防性治疗铺平道路。再给医学10年的时间,就可以使用“定制药物”来治疗这些疾病了。到2030年的时候,基因药物会将发达国家居民的平均寿命延长到90岁。

这些大胆的预言已经开始被逐步证明并实现。遗传学已经影响了对HIV、流感、癌症等多种疾病的治疗方案的设计。只针对特定基因型的乳腺肿瘤发挥作用的赫斯汀(Hercepin),已经挽救了许多生命。基因检测也使人们能够开始预测患特定疾病的风险。目前为止,柯林斯的预言还未出错。

;