Nature:RNA 修饰研究有助表观转录组学进一步发展

这是一个与 mRNA 结合的细菌核糖体的分子模式图,该核酸蛋白复合体正在合成蛋白质。

随着科研人员逐渐揭开 RNA 修饰的奥秘,帮助我们了解表观转录组学(epitranscriptomics)的工具也变得越来越多了。

2004 年,以色列特拉维夫大学(Tel Aviv University in Israel)的肿瘤学家 Gideon Rechavi 等人将当时能够找到的所有人类基因组 DNA 序列与对应的 mRNA 进行了比对。他们希望找到 mRNA 序列里的腺嘌呤(adenosine, A)转换成次黄嘌呤(inosine, I)的信号。这种 A 到 I 的转换会改变蛋白质的编码序列,对于我们人类而言,这是保证天然免疫系统正常功能的关键因素。据 Rechavi 回忆,这项工作听起来简单,但实际上非常复杂。好多个研究小组都曾作出尝试,但结果都以失败告终。这主要是因为当时的测序技术还不太发达,会产生很多错误的测序结果,比如单碱基突变结果,进而带来了很大的数据噪声。但是 Rechavi 等人使用了新的生物信息学工具,所以成功地在转录组中发现了数千个 A—I 转换位点,而一个细胞,或者物种的所有 mRNA 其实也就这么多。后续的研究又陆续将这些 A—I 转换位点的数量增加到了数百万个。

发现次黄嘌呤转换算得上是一种特例,因为科研人员只需将 DNA 序列与 RNA 序列进行比对,就能够轻易地发现这些位点。但是在 mRNA 的序列里,至少有 1/4 的核酸(A、C、G、U)是携带有化学修饰物的(我们将 DNA 序列里的这种修饰称作表观遗传学修饰),只不过现有的测序手段无法发现这些修饰物。科研人员也不知道这些修饰物会给 RNA 带来怎样的改变,因此他们正在努力解决这个问题。

近五年来,学界掀起了一股研究 RNA 表观遗传学修饰的热潮,很多课题组都将目光集中在 N6 - 甲基腺苷(N6-methyladenosine, m6A)这个核酸分子上。大家都在研究全转录组水平上的这种化学修饰,以及该修饰与人体健康和疾病的关系。但该研究面临的问题也是非常大的,因为这种修饰不仅发生在 mRNA 分子上,同时也发生在其它 RNA 分子上,几乎涉及到了生命科学的所有领域,连病毒的 RNA 都会发生这种修饰。

其实这些修饰本身并不新奇。我们现在之所以这么关注这种修饰的意义,这么关注所谓的表观转录组学,是因为发现了与这些修饰有关的酶,并且对这些酶也有了一定的认识和理解。2010 年,美国芝加哥大学(University of Chicago, Illinois)的化学家 Chuan He 提出,这种化学修饰反应是可逆的,而且对于基因表达调控具有非常重要的作用和意义。不久之后,He 的课题组第一个发现了 mRNA 化学修饰去除酶——FTO。该发现意味着 m6A 不只是一个被动的修饰物,细胞也可以逆转这种修饰反应,即 mRNA 的化学修饰是可以由细胞来操控的。与此同时,随着新一代测序技术的发展,我们将能更方便地开展全基因组范围内的测序,也让全转录组修饰(m6A 等)研究成为可能。

这就是一个甲基化修饰过的 RNA 分子,图中浅蓝色表示的就是 m6A。

今天,表观转录组学研究正在蓬勃开展,不过相关的技术仍然不够完善,还需要继续开发。比如目前的技术在灵敏性(sensitivity)上就尚有不足,无法对少量的、稀有的样本开展研究、无法对转录组修饰开展定量研究,并且无法通过一次试验发现多种不同的修饰等。美国芝加哥大学(University of Chicago)的分子生物学家 Tao Pan 也参与了 He 等人发现 FTO 的工作,他认为现在最需要的是能够检测所有 RNA 修饰物的技术。

不过这也说明,从事表观转录组学研究的科研人员对于他们正在钻研的这个领域还是非常热衷的。美国纽约 Weill Cornell 医学院(Weill Cornell Medical College in New York City)的遗传学家 Chris Mason 曾经领导过 m6A 的作图工作,她认为这就好像人们在想着 DNA 时,一定也在想着 DNA 的折叠过程,或者 DNA 的表观遗传学修饰过程。Mason 相信,现在,或者说在不久的将来,人们在想着 RNA 的时候,肯定也会同时想到它们的修饰过程。

早在上世纪七十年代初,科学家们就发现 mRNA 存在化学修饰的现象,当时使用的试验技术是对 m6A 进行放射性标记。但是因为这些试验都是通过 mRNA 3’端多聚腺嘌呤尾高选择性技术来富集 mRNA 分子的,所以科研人员们担心这会掺杂进其它种类的 RNA。据美国 Weill Cornell 医学院的化学生物学家 Samie Jaffrey 介绍,正是因为这个原因,让他们无法确定 mRNA 里是否还存在其它 RNA,以及是否发生了‘污染’,因此都放弃了这种试验方案。

另一个难题就是确定 mRNA 里哪些位点发生了 m6A 修饰,这些信息能够帮助我们了解这些基因的功能。传统测序技术会用到逆转录反应,即将 RNA 逆转录成互补的 cDNA,然后再对 cDNA 进行扩增及测序。可是这些逆转录酶会去除 mRNA 上的修饰物。对此,Jaffrey 指出,所以我们根本看不到 m6A,只能看到‘未修饰的’A。

不过虽然存在这些技术上的障碍,我们还是在细菌的 RNA 上发现了一些修饰现象,这也引起了 Jaffrey 的兴趣,她决定看看在哺乳动物的 RNA 里是否也存在这种修饰现象。

Jaffrey 和 Mason 一起,首先将 RNA 分子切成一个、一个的小片段,然后用含有特异性针对 m6A 的抗体对这些 RNA 片段进行洗脱,最后对富集后含有 m6A 修饰物的 RNA 分子测序。据 Jaffrey 介绍,通过这种方法,她们清楚地看到了 mRNA 上的修饰物,而且完全没有其它 RNA 的污染。Rechavi 的课题组也通过类似的方法发现了大量的 m6A 修饰位点,他们在人类 7000 多个基因里一共发现了将近 12000 个 m6A 修饰位点。这些位点主要都位于蛋白质编码区(外显子)内,或者终止密码子内。

目前,这些名为 m6A-seq 和 MeRIP-seq 的研究方法已经被人们广泛采用,以用于对各种疾病或器官的 m6A 开展相关研究。目前,人们可以很方便地获得特异性识别 m6A 的抗体和试剂,比如 Active Motif (go.nature.com/2kqgzu8)、MilliporeSigma (go.nature.com/2kw39m3) 和 New England BioLabs (go.nature.com/2kqjjaz) 等公司都提供这类科研试剂。科研人员们相信,这些 RNA 修饰会参与细胞分化过程的调控,而该过程出现错误就会导致肿瘤,因此 RNA 修饰很可能与肿瘤有关。实际上,我们也已经发现了表观转录组与肿瘤之间的联系。比如 He 等人就发现,某些急性粒细胞白血病(acute myeloid leukaemia)的病人,体内 FTO 的含量就明显高于正常水平,因此很多 m6A 位点都被去修饰了,这就有可能促使细胞发生分化。

但是 Jaffrey 等人做的另外一个同样的研究则获得了完全相反的结果。该研究使用的是 miCLIP 技术,该技术的分辨率更高。结果发现,m6A 抗体也能够与另外一种化学修饰物——N6,2 - 氧 - 二甲基腺苷(N6, 2ʹ-O-dimethyladenosine, m6Am)结合。M6Am 主要见于 mRNA 5’帽子结构处。不过 Jaffrey 当时并不清楚这种修饰有什么具体的生物学意义。现在他们已经知道,m6Am 才是 FTO 的作用靶点,而不是 m6A。M6Am 会影响 mRNA 的稳定性,及其在细胞内的定位。再结合上 He 之前的研究成果,这提示我们,m6Am 与急性粒细胞白血病的发病和发展有关。

美国斯坦福大学(Stanford University, California)的肿瘤生物学家 Howard Chang 认为,这些现象都是一个新兴研究领域里非常常见的,这与组蛋白修饰研究领域早期的发展状况(当时的矛盾情况更加突出)还不太一样。

肿瘤生物学家 Howard Chang

其它 RNA 化学修饰也引起了科研人员的注意。2016 年,由中国北京大学(Peking University)的化学家 Chengqi Yi 和 Rechavi 与 He 共同领导的两个课题小组使用抗体技术,对小鼠和人的细胞系,以及组织进行了 N1 - 甲基腺苷(N1-methyladenosine, m1A,早在上世纪 60 年代初就已经发现了这种化学修饰物)的作图研究。他们使用了多种不同的方法,来防止逆转录反应干扰 RNA 中的 m1A。他们都发现,m1A 位于 mRNA 的翻译起始位置。应激条件会改变 m1A 的位置,这也说明这种化学修饰是一个动态调控的过程。

虽然科研人员们还不太清楚 m1A 的具体作用,但是他们已经找到了一条比较有意思的线索,即绝大多数 RNA 都只含有一个 m1A 位点,而且这些被修饰过的位点的翻译频率要远远高于其它未修饰的位点。据 Rechavi 介绍,这一点让他们非常兴奋,当然也是一个挑战,因为他们即将面对的是一套全新的 mRNA 翻译调控机制。目前,人们可以在 MBL International (go.nature.com/2kvqpfs) 等地购买到特异性识别 m1A 的抗体。

其它全转录组化学修饰研究策略主要利用的就是某些 RNA 修饰物能够与其它化学标签结合的特性。Yi 在 2011 年末建立自己的实验室时,大家已经非常清楚,在其它 RNA 里含有很多修饰过的 RNA 组成核酸——假尿嘧啶(pseudouridines,pseudoUs),但是在 mRNA 里还没有发现过这些核苷。2015 年,Yi 的实验室发现了一种化学标记和洗脱方法,可用于富集 mRNA 上的化学修饰物。出乎预料的是,他们在人和小鼠的 mRNA 中,发现了大量的假尿嘧啶,远远超出了预期。于是他们开始专注于研究这些化学修饰物的功能。Yi 等人认为,mRNA 里的假尿嘧啶可能具有多重功能,这取决于它们在什么时候、什么位置、如何出现,以及是如何对 RNA 进行调控的。目前人们也发现了很多假尿嘧啶写入因子,但是还不清楚是否存在假尿嘧啶擦除因子和识别因子。

不论是使用抗体还是化学标记的方法,发现 RNA 中化学修饰的位置都是一项非常麻烦的工作。比如,使用抗体时会面临交叉反应的问题,因此,科研人员必须使用 2 种以上的抗体进行实验,而且还得进行交叉验证。而使用化学标记方法又有可能更倾向于切断、并结合和富集某些特定的 RNA 片段,而带来偏倚。据 Yi 介绍,测序深度和所使用的生物信息学软件也会影响影响我们发现 RNA 修饰位点的工作。此外,细胞培养时间也会影响 RNA 的修饰水平。鉴于此,Mason 认为,获得一个基准的参考图谱非常重要。

但是在任何时候,仅仅只知道某个 RNA 分子上有哪一种化学修饰是远远不够的。我们还需要对所有的 RNA 修饰进行定量分析,这也是非常重要的工作。Pan 指出,因为细胞也许就是依靠一定量的 RNA 修饰,才能够行驶某种功能。对于那些希望通过激活 RNA 修饰相关蛋白来调控 RNA 修饰水平的科研人员而言,这种修饰定量信息尤为重要。据 Pan 介绍,我们已经发现了这些 RNA 修饰相关蛋白,这提示细胞对 RNA 修饰进行精密调控的重要性。

2015 年,Pan 的课题组提出了关于 RNA 修饰水平的定量研究策略,至少可用于 tRNA 的修饰研究工作。该策略采用了一种特殊的逆转录酶,能够以较高的效率通读待测 RNA 分子,哪怕 RNA 分子中有很多位点已经发生了化学修饰,也不影响该逆转录酶的效率。这样一来,他们就可以获得全长 RNA 序列了。Pan 的课题组就正在用这种策略研究 mRNA 的 m1A 修饰问题。

但是,可能最快速了解这些化学修饰物功能的方法就是发现它们的识别因子(readers)、写入因子(writers)和擦除因子(erasers)。2012 年,他们在做 m6A 研究时就创造了用已修饰和未修饰的短 RNA 片段的富集方法。当时他们使用这些短 RNA 片段做 “诱饵”,来钓取与这些 RNA 相结合的蛋白因子。2014 年,他们课题组又使用类似的策略发现了好几个 m6A 识别因子。其他的研究也发现了这些 RNA 的其它细胞内作用。现在,Rechavi 准备尝试用这种“钓鱼” 策略来研究 m1A。不过由于 m1A 的位置更加集中于翻译起始位点,该处的分子结构更加紧密,所以实验难度可能会更大。

一旦我们发现了能够识别某种化学修饰物的因子,那么就可以很容易地通过基因编辑技术来调控该因子的表达,从而帮助科研人员从全局的角度去发现化学修饰改变的迹象。比如,Chang 就通过去除某个 m6A 修饰酶的方法,证明了该修饰作用对于细胞的命运具有决定性的意义。

但是随着表观遗传学涉及的范围越来越广,从 DNA 扩展到 RNA,如何认识和理解这些核酸上的化学修饰的功能变成了一个大难题,比如同一个酶可能会作用于好多种不同的 RNA,同一种化学修饰在不同的 RNA 上也可能会发挥不同的功能。Chang 表示,如果有一天我们发现,有一些功能是通过其它我们还没有发现的 RNA 来行使的,他一点都不会觉得奇怪。

这是一幅 DNA 分子上结合了 RNA 聚合酶的复合体的电镜照片。

近几年,He 的课题组又发现,RNA 修饰是一种转录子调控机制,它参与了细胞内多种不同的作用,比如启动细胞分化程序等。因此,科研人员们迫切需要更多、更好的新技术,来探索这方面的奥秘。去年 10 月,美国国立卫生研究院(NIH)给 He 和 Pan 提供了一个为期五年,总金额为 1060 万美元的资助,以帮助他们建立一个新中心,用于开发与 RNA 修饰研究有关的新技术。其中有一项任务就是找到一种在修饰位点引入突变,并且大量扩增这些突变的方法。

由于有了新的影像学技术,所以我们有可能在肉眼直视(visual inspection)下看到某个 RNA 分子上的修饰物。据 He 介绍,他非常想向大家介绍,已经有人开发出了能够直接对 mRNA 分子上的 m6A 修饰物进行成像的技术。不过当时的情况还不是那样的。Ye Fu 之前曾经在哈佛大学(Harvard University in Cambridge, Massachusetts)的生物物理学家庄小威的实验室里做博士后研究,他现在就正在开发这项技术。Fu 的策略是将超高分辨率的显微镜与庄小威之前开发的一个单细胞内 RNA 可视技术——多重抗误差矫正荧光原位杂交技术(multiplexed error-robust fluorescence in situ hybridization, MERFISH)结合起来。Fu 表示,他近两年已经取得了一定的进展,但目前的问题是数据噪声太大,所以还需要进一步优化,使检测的效率更高。

其它方面的工作还包括开发新的 RNA 直接测序技术,以替代传统的 RNA 测序方法。比如英国牛津纳米孔技术公司(Oxford Nanopore Technologies in the United Kingdom)的科研人员就曾经报道他们已经成功地将 DNA 纳米孔测序技术拓展成 RNA 纳米孔测序技术。美国加利福尼亚州门罗公园的太平洋生物科技公司(Pacific Biosciences in Menlo Park, California)也成功地利用自己的单分子实时测序技术(single-molecule real-time,SMRT)直接对 RNA 进行了测序。据该公司的首席科学官 Jonas Korlach 介绍,其实这个 RNA 测序技术的想法是和他们的 SMRT 测序技术同时诞生的。所谓 SMRT 测序技术,就是使用 DNA 聚合酶来扩增 DNA 分子,在荧光标记的核酸掺入新合成的 DNA 链时,同时检测荧光信号,完成测序工作。为了让这项技术也能应用于 RNA 测序工作,Korlach 和 Mason 等人将 DNA 聚合酶替换成了源自 HIV 的逆转录酶。随后还是利用 DNA 测序平台进行测序,由于当逆转录酶通过 RNA 链中发生了化学修饰的核酸位点时,逆转录速度会明显放慢,因此会产生一个很明显的反应动力学信号,借助这个信号就能够很方便地知道,哪个位点发生了化学修饰。

由于 RNA 与 DNA 存于差别,所以科研人员们碰上了很多以前在 DNA 测序时没遇到过的困难。比如 RNA 分子自身非常容易发生折叠,形成各种环状结构(loop)和结状结构(knot)。所以英国牛津纳米孔公司的方法就是让 RNA 与一个 cDNA 结合在一起,以消除 RNA 的二级结构,从而可以通过纳米孔通道。再比如,RNA 非常容易降解,所以在待测 RNA 链非常长的时候,也会带来不小的麻烦。

数据方面也有不小的困难,比如 RNA 修饰的绝对数量就是个问题。在一个 RNA 分子上找出所有的修饰,这需要对软件进行大量的、严格的训练,才能够让它们准确地识别并区分每一个修饰位点的具体情况。美国约翰霍普金斯大学(Johns Hopkins University in Baltimore, Maryland)的生物医学工程师 Winston Timp 就曾经利用英国牛津纳米孔公司的技术,自己开发了一个检测 DNA 修饰信息的技术。他现在也准备转战 RNA 修饰领域,打算开发一个能够识别 m6A 的软件。据他介绍,问题在于,他们并不清楚一个 RNA 分子上有多少个不同的修饰情况。但是有一点他们很清楚,这个领域非常有意思,值得继续深究下去。

;