这位科学家,想给人体37亿个细胞画个图

Aviv Regev喜欢挑战极限。2011年,这位计算生物学家与分子遗传学家Joshua Levin合作,共同测试一组RNA测序方法。两位科学家的目标是在极致条件下应用这些技术,来测试哪个表现最佳。他们处理了含有降解后的RNA(极少量RNA分子)的样本。最终,Levin指出他们可以测序少于单细胞中含量的RNA量。

Casey Atkins for Nature

在Regev看来,这似乎是一个机会。细胞是生命的基本单位,她一直以来都在寻找方法来探索复杂的基因网络如何在单个细胞中运作,这些网络有何不同之处,以及不同的细胞群如何共同协作。若解开了这些问题,在本质上就将解开诸如人类这样的复杂有机体的构建之谜。“所以,我们想,是时候放手一搏了,”她说。

Regev和Levin两人都在哈佛-麻省理工博德研究所工作,他们对小鼠骨髓中18个看上去一模一样的免疫细胞的RNA进行测序,发现有些细胞和其他的相比,呈现出相当不同的基因表达模式。它们运作起来就像是两种不同的细胞亚型。

这让Regev想要再进一步:利用单细胞测序来弄清楚人体内有多少不同的细胞类型,它们存在于何处、有什么作用。她的实验室从一次检测18个细胞发展到成千上万个——并结合单细胞分析与基因组编辑来探索当主要调节基因停止工作后会发生什么。

研究结果已经拓宽了已知细胞类型的范围。比如,发现了两种新形式的视网膜神经元——Regev迫不及待地想发现更多。2016年末,她协助启动了雄心勃勃的人类细胞图谱计划,该计划希望分类和定位预估的所有37万亿人体细胞(参见“绘制人类细胞图谱”)。

瑞典皇家工学院的微生物学家Mathias Uhlén说,这反映了大家对使用不同方法表征单个细胞的兴趣越来越浓。“其实我认为它是历史上最重要的生命科学项目之一,甚至比人类基因组项目更重要。”

纽约纪念斯隆·凯特琳癌症中心的计算生物学家Dana Pe'er已经认识Regev18年了,她说参与宏大的科研项目对Regev来说是常态。“Aviv的独特之处是她视野广阔。我从未见过哪个科学家像她一样在那么多事情上有如此深刻和创新的认识。”

难以抉择

当Regev还是以色列特拉维夫大学的一名本科生时,学生们必须在开展研究之前选择一个科目。但是她并不愿做出决定。“我感兴趣的科目太多了,”她说。最后,她选择了一项高级跨学科项目,这能让她同时学习大量不同的科目并且跳过本科学位,直接攻读硕士课程。

演化生物学家Eva Jablonka的辅导为她带来本科阶段的转折点。Jablonka一直推行一个富有争议的关乎表观遗传的演化观点,Regev说Jablonka在面对批评时的勇气和不屈令她钦佩。“捷径那么多,却偏有人另寻别路,这样的人总会让人另眼相看。”

在Jablonka的课上,需要解决复杂的遗传学难题,这正合Regev的心意。遗传学借助抽象推理得出根本性科学结论的方式吸引了她。她说:“我就这样被生物学深深迷住了,基因那么令人着迷,但是更令人着迷的是它们相互作用的方式。而允许它们相互作用的首个载体便是细胞。”

Regev在以色列魏茨曼科学研究学院的Ehud Shapiro指导下,完成了计算生物学的博士学位。2003年,她通过一个特殊项目来到哈佛大学鲍尔基因组学研究中心,这个项目允许研究者跳过传统的博士后阶段,直接建立自己的实验室。她说:“我有一个自己的小团队,并且完全独立。”这让她有权决定自己的研究课题。她着重通过分析细胞基因产生的RNA分子来分析基因网络。

2004年,她将这种技术运用在肿瘤上,发现一些不同类型的癌症呈现相同的基因表达模式,另外还发现了一些更加特异性的基因表达模式,比如一组与生长抑制相关的基因在急性淋巴细胞白血病中被抑制。到了2006年,35岁的她已经在博德研究所拥有了自己的实验室。

令人震惊的相似性

在博德研究所,Regev继续钻研如何从RNA测序数据中梳理复杂的信息。2009年,她发表了一篇关于一种小鼠免疫细胞——树突细胞的论文,揭示了控制该细胞如何应答病原体的基因网络。2011年,她开发了一种不使用任何参照基因组便能够组装一个完整转录组(样本基因中转录的所有RNA)的方法,这在有机体基因组未被深入测序的情况下非常有用。

就在这一时期,Levin提到了单细胞RNA测序的前景。在那以前,单细胞基因组学几乎是不可能的,因为当时的技术不够灵敏,无法检测到单细胞中微量的RNA或DNA。但是2011年左右情况开始发生变化。

他们利用18种免疫细胞——同样也是树突细胞——来测试这种方法。“我坚持要求做一次实验,证明同样类型细胞的测试结果是一样的。”Regev当时的博士后Rahul Satija说,他现在任职于纽约基因组中心。可是,他发现了两组差异巨大的细胞亚型。甚至在同一组中,个体细胞的调节基因和免疫基因的表达都不一样。“我们在这一简单的发现中看到了无限可能。”Regev回忆道。

Satija说:“我认为Aviv当时就意识到了。这些结果为我们指明了未来研究的方向。”他们可以利用单细胞基因组学所揭示出的多样性来找出有机体真实的细胞类型,并弄清它们互作的方式。

在标准的基因测序中,研究人员从许多细胞的混合物中提取DNA或RNA,得出整个细胞群体的平均读数。Regev把这种方法比作果昔。颜色和口味提示我们里面有什么,但是一颗蓝莓,或甚至是十几颗,都能轻易被一盒草莓的味道掩盖。

相反,“单细胞尺度的数据就像是水果沙拉。你可以轻易将里面的蓝莓、黑莓、树莓、菠萝等区分开来。”Regev说。这为发现此前被忽视的细胞类型带来希望。利用单细胞基因组学来测序肿瘤,生物学家能够确定哪些基因由恶性细胞表达,哪些由非恶性细胞表达,哪些由血管细胞或免疫细胞表达——这有望为治疗癌症指出更好的出路。

这种技术为许多疾病的药物研发带来了新希望。了解一种潜在药物会影响哪些基因很有用,但如果能全面排查哪些细胞在活跃地表达相应基因,那么就更好了。

Regev不是唯一一个对大规模单细胞分析着迷的人。至少从2012年起,科学家们就在思考使用这些技术绘制所有人类细胞类型。“世界各地的科学家不约而同地提出了这种想法。”斯坦福大学的生物工程师、陈·扎克伯格生物中心的联合领导人Stephen Quake说。这个生物中心从2016年9月起为各种生物医学研究项目提供经费,包括它自己的细胞图谱项目。

人类细胞图谱

2014年左右,Regev开始举办关于绘制细胞图谱的讲座和研讨会。英国威康信托基金会桑格研究所的细胞遗传学负责人Sarah Teichmann听说了Regev的兴趣,于是在去年邀请她合作一个国际人类细胞图谱项目。这个项目将不仅包括基因组学研究者,还包括各种组织和器官系统生理学的专家。

Regev欣然答应,如今她和Teichmann是人类细胞图谱项目的联合领导人。项目的目标是测序人体每一种细胞的RNA,并使用这些基因表达特征来给细胞分类,同时鉴定新细胞类型并弄清所有细胞及其分子在空间上的组织形式。

这个项目还计划发现并表征人体内所有可能的细胞状态——成熟和未成熟的,耗竭和功能完整的——这需要更深入的测序。科学家之前一直假设人体大约有300种主要细胞类型,但是Regev估计还有更多的状态和亚型等待我们去探索。Regev表示,单单视网膜可能就包含超过100种神经元亚型。目前,项目成员中已经在开展免疫细胞、肝脏和肿瘤研究的实验室正联合起来协调有关这些组织和器官的工作。Teichmann说:“我们真的才刚刚起步。”

在联合协调人类细胞图谱项目的过程中,Regev与5大洲28名科学家组成的委员会发生过争论,也帮助组织了超过500名科学家的会议。Jablonka说:“如果是我,肯定会感到筋疲力尽,但是她不会。”Regev只是简单地解释说:“和大家一起追逐同一个梦想,我乐在其中。”

之前,该项目的经费来源一直悬而未决。但是在6月,陈·扎克伯格倡议(Chan Zuckerberg Initiative)——资助了陈·扎克伯格生物中心的一个加州慈善组织——为人类细胞图谱项目的数据平台提供了一笔数量未予公开的资金及软件工程支持。该数据平台将用于存储、分析和浏览项目数据。

Teichmann认为将重点放在大型集中项目而非小型分散项目的一个关键原因是数据策管必不可少。她说:“计算是项目的核心。统一的数据处理、统一的数据浏览等,好处一目了然。”

4月,陈·扎克伯格倡议接受了一项旨在测试和发展人类细胞图谱技术及实验程序的一年期试验项目的申请。预计它将很快宣布哪些项目会获得经费。经费申请对所有人开放,并不局限于参加计划会议的科学家。

人才流失

一些科学家担心人类细胞图谱项目会夺去其他创新项目的经费和人力——许多这样的大型国际科学项目都会遭此指责。Regev实验室的一名博士生Atray Dixit说:“的确存在这种矛盾。我们知道这些项目会给我们带来一些收获,从这方面看它们是低风险的。但是这些项目又真的十分昂贵。我们怎样才能平衡彼此?”

英国剑桥大学的发育生物学家Azim Surani不确定该项目是否能完美地平衡信息的数量和深度。他说“人类细胞图谱能从广度上扩大你对细胞类型的认识,但不会从深度上加深你对不同细胞及其相互关系的认识”。“这里的投入与产出比有多大?”

Surani同样也怀疑单细胞基因组学是否已经能够作为主要研究方法被应用于大型项目。他问道:“这种技术是否已经成熟,我们是否真的能对它做到物尽其用?”比如,组织细胞分离(从组织中提取单细胞,同时避免偏倚样本或破坏内部RNA)仍旧非常困难。有些人认为,如果各个研究组按照自己的思路寻找解决这个问题和其他技术挑战的最佳方法,可能对学界更有益。

还有些人担心这个项目在实践中漫无边界。“细胞类型的定义并不明确,”人类蛋白质图谱主任Uhlén说。这个项目启动于2003年,旨在编录正常的和癌变的人体细胞中的蛋白质。可能存在几乎无限种的细胞类型。Uhlén承认人类细胞图谱意义重大且令人振奋,但是他又说:“我们需要弄清研究的终点在哪里。”

Regev则表示完成图谱并非唯一的目标。“它是模块化的:你可以将它分为好几个部分。即使只解决了一个问题的一部分,也是一个有意义的解决方案。”她说。她举例说,即使该项目仅仅编录了视网膜中的所有细胞,这对药物研发来说也是有意义的。“随着时间的推移,它的作用会一点点展现出来。”

虽然人类细胞图谱是Regev的重点工作,但是它并没有妨碍她对特定细胞类型进行更加细致深入的研究。去年12月,她的团队和另外两个团队发表了相关论文,介绍他们使用精准基因编辑工具CRISPR–Cas9来关闭大量细胞中的转录因子和其他调节基因,然后使用单细胞RNA测序来观察其影响。Regev的实验室将这种技术称为“Perturb-seq”。

它的目的是在前所未有的规模上精确细分遗传途径,具体做法是先关闭单个细胞中的一个或多个基因,,然后分析它们是如何影响其他基因的。之前,科学家一次只能对少量几个基因实施此操作,而Perturb-seq一次能在1千甚至1万个基因上操作。这些结果能揭示基因如何调节彼此;还能够展示一次激活多个基因或是之失活后产生的联合效应,这并不能通过分别调控单个细胞并观察其效应来预测。

论文的共同第一作者之一Dixit说,Regev永远不知疲倦。在接近交稿的几周里,她每天早上6点都要召开项目会议。“我在补充方法的结尾加了一句笑话——押头韵,就想看看是不是有人会发现。她真的发现了。那是交稿前一晚的凌晨3点。”Dixit说。

Regev不仅认真专注,而且乐观向上。她说:“我被幸运眷顾,从事着一份自己热爱的工作。”她对细胞的热爱仍未褪却,“无论你怎么看,它们都妙不可言。”

;