单细胞测序技术概览(2)

2.4 细胞表达差异

在美国博大研究院(Broad Institute),Aviv Regev与Joshua Levin等人在开始单细胞RNA测序工作之前,先利用质量很差、降解严重的组织样本对多种RNA测序技术进行了比较,最后她们决定采用Smart-Seq技术对骨髓来源的树突状细胞(dendritic cell)进行研究。这些树突状细胞是一种有丝分裂后的免疫细胞,能够对抗原产生非常强烈的转录反应。

Regev等人一共选择了18个细胞,耗时一周分批进行了试验。她们之前尝试了各种方法,最终都失败了。可是这一次却一次就成功了。研究发现,每一个细胞都会统一表达所谓的持家基因(‘housekeeping’genes),但是每一个细胞也都有各自独特的表达谱,与免疫调控功能相关的基因在有些细胞里的表达水平非常高,可是在有些细胞里却压根不表达。之前还从来没有在树突状细胞中发现这种两极分化的现象,因为一直以来都是对一堆细胞进行研究,细胞之间的差异全部被平均掉了。该研究成果于去年6月得以发表,该文章首次报道了一种“隐藏的”细胞类型,即非常罕见的“第一应答者细胞(first responder)”(Nature 498, 236-240, 2013)。从更广义的角度来说,这一发现有助于我们重新认识这些树突状细胞,以及它们的信号通路和功能。

单细胞RNA测序技术第一次尝试就取得了成功。

——美国博大研究所Aviv Regev

单细胞转录组测序也能够帮助科研人员研究发育早期的基因表达与调控情况,而且借助这项技术还能够以前所未有的精细程度对罕见的样品开展科学研究。比如美国加州大学洛杉矶分校(University of California, Los Angeles)的Guoping Fan与他在中国的合作者们在去年8月发表的一篇文章就对33个单细胞进行了转录组测序研究。这33个细胞全都取自处于发育不同阶段的胚胎,他们根据测序结果确定了发育初期基因的表达顺序,还发现了人类与小鼠胚胎发育过程中基因表达时限上的差异(Nature 500, 593?597, 2013)。

单细胞测序技术是一项非常强大的技术,可以帮助我们发现肿瘤细胞里的基因组变异。

——美国德克萨斯大学MD Anderson癌症中心Nicholas Navin

与此同时,Tang的课题组也在从好几个人类早期胚胎中仔细地分离细胞标本,并且对这些细胞挨个进行单细胞转录组测序。据Tang介绍,他们非常紧张,因为这些标本全都来之不易,非常珍贵。不过他们的工作也获得了回报,他们发现了2700多个新的长非编码RNA(long noncoding RNA)分子,这些分子可能都与早期基因调控作用有关(Nat. Struct. Mol. Biol. 20, 1131?1139, 2013)。据Tang介绍,在此之前,所有的单细胞RNA测序工作还都只是针对已知基因进行分析,充其量也仅仅增加了已知基因的可变剪接亚型(alternative splicing isoforms)而已。

2.5 混合的肿瘤细胞

从疾病预后判断到病情监测,肿瘤研究人员都能够从单细胞测序技术那里获得巨大的帮助。我们都知道,肿瘤细胞的突变速率非常快,而且肿瘤组织是一种高度异质性的组织。确定肿瘤组织中存在哪些细胞亚群(或者叫克隆)具备转移能力,哪些克隆对化疗药物是敏感的,这些信息对于临床工作都非常有帮助。尤其针对隐藏在人体循环系统里的循环肿瘤细胞(circulating tumor cell, CTC)进行全基因组或者转录组测序最有帮助,因为这些CTC细胞就是导致肿瘤转移的元凶,有关它们的信息对于疾病的诊断、监测和治疗都至关重要。

比如Navin于2011年在《自然》(Nature)杂志就发表过一篇文章,介绍了他们的单细胞基因组研究成果。他们发现CNV突变与肿瘤的进化模式有关,肿瘤在稳定增长之后会突然发生基因组失稳。据现在在美国得克萨斯大学MD Anderson癌症中心工作的Navin介绍,这一发现让他们非常吃惊,因为他们一直认为肿瘤细胞一直在缓慢地积累突变。这次研究工作也证实,单细胞技术非常强大,至少能够帮助他们发现人体单个肿瘤细胞里的基因拷贝数变异。Navin与他的合作者们还在继续对三阴型乳腺癌患者进行研究,主要想了解CNV方面的情况,同时也希望能够更好地了解肿瘤转移的问题。

除了Navin等人之外,还有其他几个课题组也都在利用单细胞测序技术开展与肿瘤相关的研究工作。比如前面介绍过的Xie就与中国北京大学的Fan Bai,以及美国哈佛大学的Jie Wang一起,在一种肺癌亚型(不包括其它亚型)的CTC细胞中发现了一种特定的CNV突变(Proc. Natl. Acad. Sci. USA, doi:10.1073/pnas.1320659110, 9 December 2013)。Xie认为,这些最新的进展都有助于我们开发早期诊断产品和技术。

Mike McConnell在单个人脑神经元细胞中发现了大段的DNA缺失或重复突变。

转录组上的差异也有助于我们认识肿瘤的进展情况。比如Sandberg的团队就使用他们自己开发的Smart-Seq技术对单个CTC细胞进行了RNA测序研究,并对他们的这套方法进行了验证。使用最新版的Smart-Seq2技术,他们能够以比以前更低的成本观察更多的细胞。由于观测的细胞数更多,所以让从事CTC研究的科研工作者们头痛不已的试验误差问题也能够得到更好的控制。据Sandberg介绍,他们真的希望拿出一套更加系统的解决方案,帮助大家更好地认识CTC细胞的异质性问题,帮助大家更好地认识CTC细胞进入血液循环系统时的基因表达情况。

Wolf Reik希望表观遗传学技术也能够早日达到单细胞检测水平。

比基因组和转录组研究更困难的就是以化学标志物形式附着在基因组上,并对基因的表达实施调控的表观基因组(epigenome)研究了。虽然目前的表观遗传学技术还达不到单细胞研究水平(因为传统的表观遗传学研究技术都会使DNA降解),但是科研人员们还是迫切希望看到单个肿瘤细胞的表观基因组情况。Tang的科研团队开发了一种可以对单细胞全基因组内的DNA甲基化修饰情况进行研究的新技术(Genome Res. 23, 2126?2135, 2013)。Tang认为,表观基因组研究真的也需要单细胞技术,只有这样,科研人员们才能够了解这个肿瘤细胞与它周围的肿瘤细胞有什么差别,而且这种差别是因为甲基化修饰引起的,还是因为其它机制引起的。英国Wellcome基金会Sanger研究所(Wellcome Trust Sanger Institute)的Wolf Reik团队对 50至100个细胞的甲基化组(methylome)情况进行了分析,他表示他真的很想再往前走一步。

2.6 大脑中的“禁区”

神经元细胞是最新一个被用来进行单细胞研究的对象,科学家们其实也不太清楚能够通过这些研究获得怎样的信息和结论。也是直到最近才开始有试验证据表明,神经元细胞之间也具有不同的基因组。虽然有这些研究成果,但是科学家们对神经元细胞的这种多样性也还是一头雾水。早在2001年,当时还在美国加州大学圣地亚哥分校(University of California, San Diego)工作的Jerold Chun就在小鼠的大脑中发现了染色体非整倍体现象,随后又于2005年在人类大脑细胞当中发现了同样的现象。据当时在Chun实验室读研究生的McConnell介绍,拿到这些结果之后,他们也没人知道下一步该怎么办。他们等于是发现了冰山的一角,如果细胞里存在非整倍体现象,那么一定会有很多的基因突变,或者基因组突变。

几乎就在同一时间,另外一帮科研人员发现,在人类基因组当中,平均每一个基因组里都含有80~100个具有潜在活力的L1元件(这是一种可以在整个基因组当中自我复制、自我粘贴的DNA元件),而且在大脑神经元细胞当中,这些L1元件都是有活性的。该研究,以及其它一些研究成果都证明,基因组至少是具备多样性可能的,但是这种变异的程度究竟有多大,没人说得清楚。

据美国国立精神卫生研究院( US National Institute of Mental Health)的 Thomas Insel介绍,他们还只是刚刚开始尝试去了解大脑细胞的分子多样性问题。在这个领域单细胞研究技术起到了关键性的作用,不仅仅是在确定神经元细胞和神经胶质细胞的(分类)类型方面,同时也有利于我们了解体验和发育对大脑某个区域里的基因表达有何作用。

科学家们可以用好几种方法发现单细胞基因组变异情况。美国哈佛大学医学院(Harvard Medical School)的Christopher Walsh团队就对300个取自死者大脑的神经元细胞进行了单细胞L1元件插入研究(Cell 151, 483?496, 2012)。他们只发现了几个 L1插入元件,这说明L1元件应该不是导致基因组多样性的主要原因,但至少在大脑皮质细胞和尾状核(caudate nucleus)细胞里是这样。

2013年,另外几个课题组也对单个人类神经元细胞进行了全基因组扫描研究。比如在2013年11月发表的文章就对3名健康人大脑的110个额皮质(frontal cortex)神经元细胞进行了全基因组测序研究,结果相当令人吃惊,他们发现在神经元细胞里有大量的大段CNV突变(Science 342, 632?637, 2013)。对源自健康人皮肤细胞的神经元细胞进行的研究也发现了同样的情况,而且这些神经元细胞里的CNV要比其来源的皮肤细胞更多,这说明这种源自iPS细胞的神经元细胞是一种非常好的研究材料,适合用于开展细胞多样性方面的研究工作。

实际上,虽然有了这些发现,但是神经科学家们还是很头疼,因为他们不知道这些体细胞突变意味着什么。美国弗吉尼亚大学(University of Virginia)的遗传学家Ira Hall也是去年这篇发表于《科学》上的文章的合作者之一,他认为这些研究意味着大脑对影响和干扰的抵抗力很弱,另外,遗传嵌合现象(genomic mosaicism)也能够影响人们罹患肿瘤和其它疾病的风险。为了明确大脑中哪些部位与其它部位相比更容易受到干扰,以及大脑不同区域间的差异有多大,科研人员们还得研究更多的细胞才能够找到答案。现在就在从事这方面研究的McConnell认为现在还是一无所知。

2.7 概念验证之后的工作

虽然单细胞技术已经有可能解决很多生命科学领域的重大问题,但是技术上的进步还远远没有结束。比如科研人员就必须研究如何将真正的生物学差异与试验技术本身的背景噪音区分开。瑞典KTH皇家理工学院(KTH Royal Institute of Technology in Sweden)的Joakim Lundeberg(他们实验室就曾经开发过组织RNA测序技术)就认为,单细胞RNA和DNA测序技术还远远算不上足够强大,他表示,他们还需要在一次试验中对更多的单细胞进行分析,以便解决背景噪声问题,这至少也能够加深他们对同一个组织里不同细胞之间差异的了解。

由于存在方方面面的问题,比如细胞分离、数据运算、以及用于不同领域时出现的特异性问题等等,所以Blainey希望在未来的几年里单细胞研究技术还能够有更大的进步。

对于新进入这个领域的人而言,光是选择哪一种转录组测序技术可能就够他们头疼半天的了。关于这个问题,应该视研究目的而定,比如是想对多个细胞进行分析,找出同型的转录子,还是想发现低丰度的RNA。“不过有多种方法可供选择总归是件好事。”Quake这样说道。在去年10月,Quake的课题组发现,如果将预处理时的反应体积控制在纳升级(他们使用的是Fluidigm公司提供的C1系统),那么单细胞qPCR技术和单细胞RNA测序技术的检测效果是差不多的(Nat. Methods 11,41?46,2014)。“这对于我们整个试验操作的可信度而言是一个重大的好消息。”Quake补充道。

随着商业化产品的推出,以及各个实验室经过多年实践总结出了自己的“独门秘笈”,基因组扩增技术的选择也在同步改善。不过由于每一个人使用的进行基因组扩增的技术都不一样,所以很难对不同的研究成果进行直接的比较。比如Xie就认为,他们感觉MALBAC技术要比MDA技术更好,但是这也要取决于你是如何进行MDA试验的。不过随着技术的不断进步,这两种技术都将会过时被淘汰,但我们也会继续改进这些技术,MALBAC一定会赢得最终的胜利,我们会让这项技术变得更好。

与此同时,从事肿瘤研究、脑神经科学研究、微生物研究、以及从事药物开发和其他领域研究的科研人员也都会从这些技术进步当中受益。而且这些技术进步也会吸引众多优秀的人才加入单细胞研究领域,比如已经在表观遗传学研究领域颇有建树的Reik等。Reik在去年才第一次参加单细胞学术会议,而在此之前还从来没有接触过单细胞研究,看到这么多新技术,Reik感到非常激动。他指出,最开始人们会因技术本身而激动,过不了多久,人们就会利用这些新技术去解决重要的生命科学问题,那将是更加令人激动的事情。

3. 单细胞分析技术——认识遗传多样性的利器

技术上的新进展已经让单细胞基因组测序技术(single-cell genome sequencing)逐渐成为了一项主流的检测手段,该领域的研究工作已经初步揭示出细胞之间在基因组结构(genetic architecture)与遗传变异性(genetic variability)方面的差异,这也反映出基因组并非一成不变的天然本质。

Flemming在1882年时发表的文章中绘制的单细胞基因组染色体模式图。

其实单细胞基因组分析这个项目很早就出现了,早在1882年就有人报告了昆虫唾液腺的单细胞图像,该图展示了多线染色体(polytene chromosomes)的带状结构。到了1935年,Calvin Bridges又发表了一幅类似的果蝇(Drosophila)细胞基因组图片,从这幅图中可以看出个体之间、品系之间,以及种系之间都存在大范围的基因组重排(genomic rearrangements)现象。最近研究人员也开展了大量的单细胞研究工作,使用的主要技术手段包括PCR和其它生化扩增技术。其中比较知名的工作包括在20年前开展的对单个精子细胞(single sperm cell)进行的重组热点(recombination hot-spot)研究,以及现在在人工辅助生殖工作中常规开展的胚胎植入前的胚胎单细胞遗传诊断工作(preimplantationgeneticdiagnoses)。既然单细胞检测技术已经发展了一个多世纪了,为什么现在才突然火起来呢?

我们认为这应该与最近取得突破的单细胞基因组测序工作有关。这主要包括以下三个方面:技术进步使全基因组及转录组扩增的效率大幅度提高;DNA测序技术的跨越式发展使得测序的通量更高,测序的成本更低;微流体技术(microfluidics)和荧光活化细胞分选技术(fluorescence-activated cell sorting)等不断涌现的新型单细胞试验技术。最近这5年,全世界各个实验室里出现了一大批单细胞研究论文,包括单细胞基因表达研究、单细胞基因组分析研究,以及商业化的服务等,这些工作对新技术的推广起到了非常重要的作用。单细胞基因组分析现在就是一个非常有影响力的技术,而且涉及了很多的方面,比如微生物生态学(microbial ecology)、肿瘤、产前诊断以及人类基因组结构及变异等。接下来我们将重点介绍这几个方面的最新进展,以及未来可能的发展方向。

3.1 单细胞生物的单细胞测序

微生物生态学是最适合进行单细胞基因组测序的研究项目,因为据估计,绝大多数(99%的物种)微生物都是无法进行人工培养的。这些不能培养的微生物被科学家们形象地称作生物界的“暗物质(dark matter)”,因为我们只能根据对标志基因(marker-gene)序列的检测来间接地“观察”这些暗物质。虽然元基因组技术(metagenomic approaches)有助于我们了解这种复杂环境里的基因组成情况,但是物种与基因之间的关系还是不得而知,因此只有借助单细胞基因组技术才能够了解单细胞生物(unicellular organism)与自身基因组功能之间的关系。这也说明我们现有的基因组数据库还相当欠缺,有大量的遗传与进化多样性信息都没有被收入在内。

科学家们开展的第一个不能人工培养的单细胞生物基因组测序工作就是针对人类牙菌斑(human tooth plaque)上的细菌开展的。最近几年已经发表了十几篇有关不能人工培养的单细胞生物基因组方面的论文,随着单细胞研究技术与测序技术的进一步发展,我们相信这方面的工作会以指数扩增形式迅速发展起来。随着这些数据的不断积累,我们也会陆续发现更多新的、以前未知的微生物功能和微生物代谢产物(metabolites),发现更多与人类身体健康相关的新物种,甚至有可能彻底改变生命之树的结构,颠覆真核生物、细菌和古细菌之间传统的进化学关系。

微生物在形态学(morphology)、生理学(physiology)和基因型(genotype)方面的多样性也给单细胞分析技术带来了不小的挑战。在我们选择单细胞分析技术、试验反应和化学试剂时,需要考虑每一种样品的特殊性。比如,微生物试验经常需要非常严格的裂解条件,而且不同的微生物往往需要不同的试验条件,这就会增加试验操作的复杂程度。由于在核酸扩增之前并不一定需要进行 DNA纯化操作,所以扩增试剂就需要能够与细胞裂解试剂兼容。复杂的裂解及扩增操作流程比较适合微孔板试验和需要用到整合技术的微流体设备的试验操作,因为这些操作都可以实现自动化。有意思的是,当反应体系缩小到纳升(nanoliters)时,生化扩增仪的表现反而会更好。相对简便的操作规程比较适合反相乳液液滴系统(reverse emulsion liquid-droplet systems)试验,使用这种系统可以快速地进行数万个独立的微反应。到目前为止,几乎所有的单细胞微生物测序结果全都使用了同一个全基因组扩增反应,即多重置换扩增技术(multiple displacement amplification, MDA)。该技术是一种等温的扩增技术(isothermal amplification),使用随机引物,主要依赖的是ɸ29 DNA聚合酶的链置换功能。

3.2 人类单体型(human haplotypes)研究

人类基因组分析工作已经从确定所有人的 “平均”参考序列(reference sequence)快速进入个体基因组测序时代,看起来单细胞技术似乎也帮不上太多的忙。但是我们人类基因组中有一些部分使用传统技术进行分析还是有比较大的难度的。比如人体内的每一个细胞里都含有两套基因组,其中一套来自父亲,另外一套来自母亲,这就叫做单体型现象,而每一个单倍体基因组(haploid genome)中的变异都会对基因的表达、蛋白质的功能,以及疾病造成非常大的影响。

人白细胞抗原( human leukocyte antigen, HLA)编码基因变异就是非常典型的例子, HLA基因单体型信息是骨髓移植工作中非常重要的一项信息,不过这只适用于非常复杂的杂合突变(heterozygous mutation)——在一个基因位点上发生了两个突变。如果这两个突变都位于同一个单体(一条染色体),那么可能是无害的,但是如果分别位于两个不同的单体,那么就极有可能是有害的。现有的技术还无法在基因组的层面上进行这种单体区分(haplotype determination)。传统的、进行单体区分最精确的方法需要对一个家系( family pedigree)进行测序,主要是对父母进行测序。很明显,在临床上大规模开展这种工作是不现实的。

不过单细胞染色体分离技术(Single-cell chromosome isolation)帮了我们的大忙,这是第一种全基因组单体型测量技术(genome-wide haplotype measurement),能够对完整的染色体进行单体鉴定。该技术出现之后很快就与其它技术搭配起来,比如只需要用到少量细胞(不过对于男性精子细胞来说可能需要的细胞数量会多一些)的单细胞测序技术(single-cell sequencing approach)等。我们希望这些技术,以及确定基因组片段单体型的长读长测序技术(long-read sequencing technologies)能够得到更进一步的应用,以促进我们对人类基因组的认识和了解。HLA编码区是我们人类基因组中多态性最明显的一个区域,该区域与人类免疫系统关系密切,也与多种人类疾病有非常直接的联系,所以一直都是研究的热点。不过由于HLA的单体型太过复杂,所以迄今为止也只对少数几个人的HLA区域进行过单体型测序。

单细胞基因组研究工作涉及的另外一个领域就是对各种人的重组方式(recombination pattern)的研究。所谓重组指的是精子细胞和卵子细胞内分别遗传自父系和母系的两条染色体大片段各自断裂,然后相互再连接,形成一个全新的基因组的过程,这也是造成人类遗传多样性的最主要原因。我们知道,整个基因组内的重组几率并不是完全一样的,即存在所谓的“重组热点”,这些位置发生重组的几率要比基因组内其它区域更高。单细胞基因组分析工作的最早成果之一就是发现在不同的个体之间,这些重组热点也会有所差异,这些热点对于某些人而言的确是热点,但是对于另外一部分人来说其实也不是那么热。最近,单细胞研究技术已经被用于分析全基因组重组模式

(genome-wide recombination pattern),以及单个精子细胞的突变率等,世界上也有了第一个针对不同个体的全基因组热点行为研究(genome-wide hot-spot behavior)。我们希望未来的单个精子细胞基因组研究也能够涉及重组突变(recombination mutant),比如对携带罕见PRDM9等位基因的个体开展研究;以及针对与不孕不育疾病(sterility and infertility)相关的、可用于临床诊断的减数分裂功能紊乱(meiotic dysfunction)的研究。

3.3 体细胞突变研究

越来越的人开始慢慢认识到个体基因组测序的意义和价值,不过目前的个体基因组序列指的还是人体内所有细胞基因组的“平均”序列。科学家们在几十年之前就已经发现,人体某些(种)细胞之间是存在基因组差异的,比如属于我们人体免疫系统的B淋巴细胞就是一个很好的例子。每一种B细胞都会严格表达一种特定的抗体,这些B细胞基因组里的基因是绝对不会被重编程(reprogram)的。正如前面已经介绍过的,生殖细胞在减数分裂和遗传重组的过程中也会出现分化和差异。在细胞不断的分裂过程中,以及在可移动的遗传元件(mobile genetic elements)的转移过程中也会慢慢积累各种突变,这些突变都具有非常重要的意义,不过我们目前对此了解得还不是特别清楚。

这些不断积累的突变与衰老,尤其是与肿瘤有非常密切的关系,所以衰老和肿瘤这两个研究领域一定会是单细胞基因组分析技术大显身手的舞台。到目前为止,已经有科研人员利用单细胞研究技术对人体精子细胞和永生化细胞系细胞进行过研究,他们直接检测了这些细胞的自发突变速率(de novo mutation rate)。还有人用这些技术对造血干细胞进行检测,以确定这些造血干细胞的突变程度,判断正常的造血干细胞转化成急性髓性白血病(acute myelogenous leukemia)肿瘤细胞之后的突变程度是不是有了一个大幅度的提升,并借此了解这些白血病肿瘤细胞的演变规律,判断乳腺癌细胞的克隆结构(clonal structure)等。

在成体神经组织里也存在嵌合型突变(Mosaic variation),这些突变与阿尔茨海默病(Alzheimer\&\#39\;s disease)等神经退行性病变有关。最近,有科研人员利用单细胞MDA等基因组分析技术在诱导性多潜能干细胞(induced pluripotent stem cell)分化的神经细胞和尸检获得的脑细胞(postmortem brain cell)中发现了大段的(达到 MB级别的)基因拷贝变异(copy number variation)。也有人利用单细胞MDA技术和以PCR为基础的全基因组扩增技术发现了 L1逆转座子(retrotransposition)是促使大脑细胞内出现体细胞嵌合突变的潜在因素,而且还用这种方法发现在不到1/3的脑细胞里存在的突变也同样能够诱发严重的疾病,比如半侧巨脑症(hemimegalencephaly)等。荧光原位杂交技术(fluorescence in situ hybridization)也被用来研究小鼠大脑中部分非整倍体(aneuploid)的神经元细胞与小鼠衰老之间的关系。这是一个让人着迷的研究领域,有各种证据表明嵌合型体细胞突变与机体发育相关,也具有一定的功能,在正常的成熟神经组织里一样能够发现这些突变。这可能就是“正常的”神经表型之间的差异能够导致神经疾病的原因,这些差异也可能与心理疾病相关,而且突变会随着年龄增长越来越多。

3.4 何时需要单细胞测序

什么时候进入单细胞基因组测序项目才合算呢?肿瘤基因组是一种高度异质性的核酸,而且突变的速度非常快,所以对肿瘤组织进行单细胞基因组测序是最合适的。虽然大批量的肿瘤组织测序并没有让科研人员们清楚地认清肿瘤组织的亚克隆组成情况,可是如果再使用单细胞基因组测序技术,我们就可以获得更详细的信息,明确基因组中核酸序列存在高度异质性情况的基因组位点。这种分阶段的技术极大地降低了测序成本,因而增加了对某个肿瘤组织进行测序时可以进行单细胞测序的细胞数目和测序次数。

虽然目前我们还不能确定,对某个肿瘤组织进行多次、大量的单细胞全基因组测序在经济上是否划算,但是对基因组中的重要部分进行分析,或者用测序深度较浅的方法(shallow sequencing)进行低分辨率测序,了解细胞里的基因拷贝数变异情况,也能够得到同样的结果。其实Bridges在80年前开展果蝇基因组研究时就是这么干的。还有一种办法可以代替这种分阶段策略,而且只需一步,那就是对多个单细胞进行全外显子组测序,这样一方面能够了解到肿瘤组织的“总体”外显子组情况,另外也可以发现肿瘤组织内部的亚克隆组成情况,而且成本要比全肿瘤测序(whole-tumor sequencing)经济得多。

3.5 植入前测序

单细胞测序有时是我们发现罕见、或独特细胞的唯一手段。胚胎植入前遗传诊断(Preimplantation genetic diagnosis, PGD)是接受体外受精(in vitro fertilization)等人工辅助生殖技术帮助的夫妻常用的一项技术,在胚胎被植入母体之前,医生们会从体外培养的胚胎中提取一个细胞,对其进行基因组分析。不过对之前开展的临床试验进行荟萃分析(meta analyses)发现,PGD并不是筛查遗传疾病的有效手段,因为在随机对照实验中发现,许多更先进的技术成功率更高,而且生出孩子的几率几乎会高出一倍。应用微阵列比较基因组杂交(array comparative genomic hybridization)等全基因组分析方法可以在胚胎植入前以更高的分辨率对胚胎的基因组进行检测。我们希望这些更高分辨率的基因组分析技术能够尽快应用到PGD临床实践工作当中,能够对胚胎进行结构异常、甚至是点突变的检测。所得的这些数据就可以帮助临床医生们进行更加精细的判断,以了解哪一些胚胎更加健康,可以生下一个健康可爱的宝宝。

3.6 单细胞技术的未来

测序的成本肯定还会不断地降下去。近十年来也诞生了很多生化DNA扩增技术,而且现在又出现了多种单细胞试验手段。然而,目前还没有哪一种核酸扩增技术是绝对的赢家,如果真的出现这样一种技术,那对所有人都会是个意外的大惊喜。但是很难说哪一种核酸扩增技术是最好的技术,因为有很多参数需要考虑。尤其是以下这几点,比如样本类型、反应方式、方便程度(恒温反应还是变温反应,一步法还是多步法)、成本(商品化的还是自制的)、可靠程度(脱靶情况、污染品扩增、扩增时的均一性和误差、扩增技术的覆盖度、错误率,以及嵌合等人工误差)以及最终的得率等。

另外,在比较这些不同的扩增技术时,一定要使用在统计学上相关样品的单细胞样品进行评价,而且一定要避免反应体积、反应方式、裂解条件、污染、样品特异性的差异和细胞间的随机差异所带来的影响。因此,只有针对这些因素做好对照才能找出最好的扩增技术。

另外,还需要开发出自动化的单细胞分离和基因组扩增技术。现有的技术能够处理数百个数量级为单位的细胞,我们可以使用商业化的细胞分选仪完成细胞分选工作,也可以用机械手完成细胞裂解和核酸扩增反应,还可以用微流体设备自动完成上面这一整套操作。自动化和小型化是未来单细胞测序仪的发展方向,这是因为只有分析足够多的样本才能够充分认识样品里的遗传多样性。我们希望芯片技术、微流体技术,以及微型零件加工制造技术(microfabricated approach)都能够有创新性的发展。这样将会极大地提高处理的通量,同时也能够大幅度降低测试成本(降低几个数量级),还可以简化反应步骤,如此便可以在一次实验中对数万个细胞进行单细胞分析。我们相信这只是个时间问题。

单细胞基因组分析技术实际上是多项技术共同发展的结果,而且涉及了生命科学领域里多个基础领域,这将有助于我们解决生命科学领域里的多个重大问题。我们希望随着核酸扩增技术和反应类型的不断发展和多样化,单细胞测序技术的影响力能够进一步扩大,应用到更多的领域,以帮助我们更好地认识和了解整个生命系统。

4. 生物学及医学开始进入单细胞转录组学研究时代

最近的技术进步使得单细胞RNA测序成为了可能。探索性研究已经让我们见识了分化的动态变化过程,细胞对各种刺激做出的反应,以及转录的随机本质。我们正在步入一个单细胞转录组学时代,该研究方向会对生物学和医学产生深刻的影响。

我们现在提到的转录组学(transcriptome)主要源于近二十年来在生物学研究工作中成为主流的群体观测工作(population-level observation)。我们一直习惯于这样一种研究思路,即对整体组织或某个条件下的基因表达倍增情况(明显的或细微的)进行比较,但是细胞之间的实际差异可能会更明显。某些细胞可能会产生非常明显的改变,可是另外一些细胞却“无动于衷”,如此一来,即便那部分发生改变的细胞的变动幅度再大,也会被“沉默的大多数”细胞给掩盖掉和稀释掉。实际上,早在60年前就已经发现,刺激单细胞会得到“全”或“无”这两种截然不同的结果,可如果对一大群细胞进行研究就会得到一个渐进的、可定量式的反应结果。

很明显,对单细胞的基因表达情况进行检测和分析非常有助于我们了解细胞的行为,以及明确都有哪些细胞参与了组织发育、成熟和病变的过程。为了达到这个目的,就需要对单个细胞进行长期的转录组学研究。但是实验技术直到最近才发展到能够对单细胞进行RNA测序的水平,科学家们才能够借助这项技术了解单细胞在基因表达方面有意义的差异。现在也出现了非常详细的实验指南,帮助科研人员构建测序文库,而且FluidigmC1等商业化的单细胞全自动制备系统也极大地降低了广大科研人员涉足这个领域的门槛。单细胞实验操作技术的广泛应用将对我们产生深远的影响,也将帮助我们加深对细胞状态、转录本质以及基因表达调控,乃至对疾病病理进程的认识。

4.1 信噪比问题

单细胞转录组研究工作主要依赖逆转录反应(reversetranscription)。首先,将待研究的RNA逆转录成cDNA,然后再通过PCR反应或体外转录反应(invitrotranscription)进行扩增,最后对扩增产物进行深度测序。不过其中扩增反应非常容易出错,也容易丢失信息。这是由于单个细胞里含有的RNA非常少,所以需要对这些微量的核酸进行大量扩增,以致这个扩增反应产生了大量的偏差。虽然技术噪声会干扰科研人员对低丰度的RNA分子进行高分辨率的测序,但是当前经过改进的实验操作流程已经可以让我们获得足够多的单细胞转录组信息。比如,在单细胞转录组学研究工作中有一个屡次被提及的问题,那就是在未对细胞进行分类的情况下,如何根据细胞的类别或状态对细胞进行准确的、可重复的分类。与细胞类别,或者发育阶段相关的基因表达模式是一个比较可靠的判断依据,远比与细胞周期等动态进程相关的生理变量或者技术噪声值得信赖。另外,有人已经对不同细胞里成百上千个基因的表达差异进行过研究,证实这种单细胞研究技术的确能够发现有意义的信息。最近开展的更深入的研究工作将进一步提高单细胞测序研究的信噪比,因为我们将进一步提高逆转录和PCR反应的效率,也可以采用分子标签(molecular barcoding)策略来控制核酸扩增反应中出现的偏差。

4.2 单细胞转录组学研究工作中存在的挑战

科研人员们基于几种不同的目的开发出了现有的单细胞 RNA测序技术。比如可以对转录子全长序列进行测序,这样就能够了解整个基因和各种转录子亚型(transcript isoform)的序列信息,也有利于我们发现并监测单核苷酸多态性(single-nucleotide polymorphisms)和其它突变的情况。而主要依赖标签,只对转录子5\&\#39\;或3\&\#39\;端进行测序的策略则可以在牺牲全长序列信息的前提下为我们提供与转录子丰度相关的信息,有利于大规模开展分子定量研究。

不过整个单细胞测序界全都在追求同一个目标,那就是用一种经济、高通量的技术对细胞里所有的RNA进行全长序列测序。其中在进行核酸扩增之前如何减少RNA的丢失率,提高RNA逆转录成cDNA的效率是需要重点突破的技术难关,也是有助于提高RNA检测成功率的关键所在。另外一个同样重要的技术就是如何对单细胞进行分离、分类及分选,而且是在不给细胞基因表达情况带来任何扰动的前提下从整块组织中分离得到单个的细胞样品。另外,科研人员们还希望能够在不考虑转录子长度的情况下,同时对poly(A)+ RNA和poly(A)?RNA,以及各种RNA修饰体(比如 m6A)进行检测。

我们现在已经发现,在单细胞测序研究工作中,细胞转录过程有一大特点,会给我们的研究带来非常大的麻烦,那就是我们在对细胞群体的研究工作中发现的细胞基因表达规律在单细胞的水平上其实一点都不可靠,任何随机的扰动都有可能使该基因在某些细胞里不表达,或者表达量很低,但也有可能变得很高。这种多变性可能是因为细胞内的基因表达是一个随机的分子进程,所以在单个细胞内,基因的转录就是一个或全或无的概率性事件。科学家们已经对原核生物和单细胞的真核生物进行过大量的研究,对基因转录的这种随机本质有了非常深刻的认识和了解,现在越来越多的证据表明,哺乳动物细胞内其实也是一样的。因此,我们在开展单细胞转录组学研究工作时也需要注意这一点。比如,标准的基因表达差异试验(differential expression test)可能就不太适于进行单细胞研究,因为在这些被研究的细胞当中,可能有一部分细胞里就没有相应基因的表达。现在已经出现了适于这类研究工作的试验策略,可以将转录子丰度差异与细胞基因表达比例差异结合起来进行观察。

到目前为止,开展单细胞转录组研究时还是需要单细胞悬液(比如组织解离液或者细胞培养悬液)做检测样品,但这种样品不能反映细胞在组织里的空间组织结构信息,除非我们知道这些细胞取自组织的哪一个部位。RNA原位杂交(RNA in situ hybridization)技术可以部分体现这种空间组织结构信息,能够了解组织里某些特定细胞里特定基因的表达情况。不过现在也有人在开发能够同时了解空间结构信息与转录组信息的单细胞研究技术,比如芯片式的多路测序技术(array-based multiplexing strategy)或原位测序技术(in situ sequencing)等。这类技术出现之后将帮助我们了解正在发育中的、成熟之后的、或者病变组织内的单细胞转录组情况,让我们对生命与疾病有更深入的了解,发现转录组与细胞间相互作用、组织极性形成以及局部差异之间的关系。

4.3 单细胞测序技术与生物学的关联

对单个细胞内的基因表达情况进行研究将彻底颠覆我们对基因表达调控的认识和理解,也将解决很多长久以来一直困扰着我们的生物学难题。比如细胞聚集在一起是由细胞种类决定的,还是因为在发育的过程当中,根据细胞的表达谱而决定的。如果是根据细胞基因的表达情况来决定的,那么在对足够多的单细胞进行测序之后我们就可以准确无误地重建出(这也叫反向工程学技术)任何细胞(下图)。如果被研究的细胞数量足够多,而且已经彻底解决了试验误差的问题,那么这种研究就可以发现组织里的所有细胞类型,包括那些尚未被发现的新型细胞。同一个群体的细胞也可以被用来发现特定细胞类型的基因表达谱,此时也一样是以测序结果为依据,也同样在事前不知道哪些组织或细胞里会表达哪种标记基因的前提下。因此,单细胞RNA测序是一种以试验结果为基础的,可以对细胞种类进行定量分析的研究手段。

图:对组织和不同的细胞进行单细胞转录组分析。首先将健康组织和病变组织解离,制成单细胞悬液,然后利用单细胞RNA测序技术,以及获得的基因表达谱信息对细胞进行单独的聚类分析,最后可以得到一张细胞聚类分析图。根据此图可以了解组织的细胞构成情况,甚至还可以发现以往不知道的未知细胞。如此丰富的信息还可以用来解决其它生物学问题,比如同种细胞和组织内,或者不同的细胞或组织间的基因表达情况和基因表达调控情况等。

单细胞转录组学研究还可以提供高质量的细胞转录组图谱,这不仅针对稳定的细胞状态,也同时针对复杂多变的细胞状态,比如细胞分化或重编程时的状态。不过要达到这种研究目的,就必须对覆盖整个阶段的、数量足够多的单细胞进行测序研究,这样才能在事后的数据分析工作中重点关注其中的某一个阶段(比如开始出现不同分化方向的那个时刻),得到有价值的研究成果。样品量还反映了我们预计会得到多少细胞种类,或者有多少生物学事件会发生。当然,这也取决于人类基因组当中基因转录的幅度究竟有多大,因为有多个研究发现,人类基因组当中很多基因只发生了很少的转录,平均1万个细胞里只发现了一个转录子拷贝。这种转录子可能是在很少量的细胞里高度表达(比如平均在10万个细胞里有一个细胞内的拷贝数超过了10个),或者是在大量的细胞里都维持非常低的表达水平,即所谓的渗漏表达。对大量的细胞(数千个)进行研究可能会解决这个问题,也有助于我们认识细胞内整体的转录水平和整个细胞的基因表达调控网络。

对人体组织和细胞进行RNA测序分析已经证明,RNA研究手段可以用于各种转录组学及蛋白质组学研究。进行组织比对时发现,大量的差异都是非常细微的,但是发现可变剪接(alternative splicing)情况、多腺苷酸化(polyadenylation)情况和转录起始位点的选择,在单细胞层面上都是一种全(开)或无(关)模式,这也与之前的单细胞研究结果相吻合。针对可变多腺苷酸化调控机制的研究发现,在增殖比较活跃的细胞里,以及体外培养的转化细胞里,转录子3\&\#39\;端非编码区都比较短。单细胞RNA测序技术尤其适用于对体内的肿瘤细胞进行分析,因为针对一堆转化细胞、间质细胞和其它浸润细胞单独提取转录产物进行分析,可以了解各种转录产物的丰度和亚型信息。对离散的肿瘤组织和健康组织进行单细胞转录组分析还可以精确地确定与转化状态相关的、不同的mRNA亚型。

;