解读甲基化组新观点
生物通,2012-11-12
在真核生物中,DNA甲基化通常发生在CG中的胞嘧啶上。由于甲基化不会改变DNA序列,它被视为一种表观遗传学标志。DNA甲基化可以在细胞分裂过程中延续到子代细胞,这一机制现在已经相当明确。而这种继承性使DNA甲基化成为储存表观遗传学记忆的潜在途径,这种记忆包括环境或发育过程中的基因调控。不过要证实DNA甲基化有此功能并不容易,不仅要力证DNA甲基化模式与特定转录模式相符,更重要的是要证明甲基化模式控制着转录。
DNA甲基化在植物和脊椎动物中广泛存在,但只有某些真菌和昆虫存在DNA甲基化,并且甲基化模式在,不同进化分支之间差异很大。植物和脊索动物的DNA甲基化主要在基因和重复序列上,而脊椎动物基因组中的甲基化几乎到处都是,只有个别特殊调控区域除外。在哺乳动物基因组中CG二核苷酸分布不均,CG岛(富含CG的调控区域)多数是不含甲基化的,该区域甲基化能够使其被有效抑制。不过,CG岛只占我们基因组的1%,其余99%的区域含CG较少,而在这些区域中DNA甲基化对基因调控的影响还远未明晰。
DNA甲基化抑制基因的一个典型例子是印迹基因的GC岛启动子,该区域中不同等位基因的甲基化情况不同,与之结合的蛋白因子也有差异,这些印迹基因的表达情况决定于其亲本。研究显示,甲基化CG岛可能通过招募大量蛋白来介导上述抑制作用,这些蛋白含有甲基化CG结合域,能够特异性识别甲基胞嘧啶。也有研究敲除了de novo甲基转移酶基因,发现当相应CG岛未被甲基化时一些基因重新活跃起来。
有些特定转录因子对其结合位点的DNA甲基化很敏感,例如MYC和YY1。在这种情况下,即使是在CG含量少的区域,启动子、增强子等基因调控区域的甲基化也会阻止转录因子结合,从而抑制基因表达。
随着DNA测序技术的日新月异,人们可以在整个基因组中检测胞嘧啶甲基化,分辨率能够精确到单个碱基。以这种技术生成的甲基化组methylome,向人们揭示了DNA甲基化在基因组中的准确定位,尤其是在CG含量少的区域。有趣的是,当且仅当基因活跃并被转录因子结合时,CG含量少的远端调控区域中DNA甲基减少。看起来这似乎将DNA甲基化与增强子活性联系了起来,但迄今为止的数据显示,转录因子结合发生在DNA甲基化改变之前,说明甲基化并未调节增强子活性。人们还不清楚上述现象是否具有普遍性,不过很可能在CG较少的序列中,DNA甲基化的许多改变是基因调控的产物而非其原因。据此我们可以进一步推测,个体间DNA序列的突变让调控区域的甲基化情况发生了改变。实际上,许多个体间的DNA甲基化差异可能都是由于基因突变引起的,而非表观遗传学层面上的。
在测序基础上对高分辨率甲基化组进行分析,人们看到外显子和内含子之间也存在甲基化差异,暗示DNA甲基化可能参与了调控剪切。不过,剪切差异明显与RNA聚合酶的延伸速度有关,还未有证据证明甲基化可以对此加以控制。而且目前就单个基因来说,外显子和内含子之间的甲基化差异并不明显,只有在比较数千个基因的平均甲基化状态时这样的差异才比较明显。人们还不清楚这样微小的差异如何对单个基因产生影响。
这种高分辨率甲基化组也存在着不足,这样的技术生成的是DNA甲基化的静态图,无法展示甲基化稳定性随时间推移的变化。在生殖细胞系和早期胚胎中,存在活跃的去甲基化浪潮,而且有研究指出特定位点的去甲基化与体细胞的分化有关。
最近发现的TET酶家族(ten-eleven translocation)为我们展示了一个活跃的去甲基化机制,也让我们能够识别其作用位点。TET酶可以氧化5-甲基胞嘧啶,而这个酶促反应的产物(5-羟甲基胞嘧啶)能够被多种方式检测到,并且可以精确到碱基。TET蛋白出现在不分裂的体细胞中,羟甲基胞嘧啶也是如此,这说明活跃的DNA去甲基化可能发生在每个细胞中。这种去甲基化现象看起来并非是随机产生的,举例来讲,TET1就优先出现在未甲基化的CG岛。对于表观遗传学记忆的观点来说,阐明DNA去甲基化的位点和动力学很关键。如果DNA去甲基化的浪潮持续存在,那么DNA甲基化又怎么能在基因组水平上储存信息呢?
目前一些大型表观基因组学项目正在研究多种组织中的甲基化组,这将有助于人们将基因型与表观基因型更好的联系在一起。可以想见,许多甲基化是DNA序列中的固有信息。要正确解读甲基化图谱,就必须进一步将指导基因调控的甲基化与转录因子结合所造成的甲基化状态区分开。