“Dark DNA”改变我们对基因组进化的思考
DNA 测序技术正在帮助科学家解开人类在数百年一直询问的动物谜题。
通过绘制动物基因组,我们现在更清楚地了解,长颈鹿的脖子为什么那么大,蛇为什么有那么长的身子。基因组测序使我们能够比较和对比不同动物的 DNA,并且发现这些动物如何以自己特有的方式进化发展。
但在某些情况下,我们面临着一个谜题。一些动物的基因组似乎缺少某些基因,但是这些基因会出现在其他类似的物种里,而且动物的存活都必须有这些基因的存在。这些明显缺失的基因被称为“Dark DNA”,而它的存在可以改变我们对进化的思考方式。
我和同事第一次遇到这种现象是我们在测序沙鼠(嗜沙肥鼠)基因组的时候,这是生活在沙漠的一种沙鼠。我们特别想要研究与生产胰岛素相关的沙鼠基因,以了解为什么沙鼠特别容易患二型糖尿病。
但是,当我们在寻找一种控制胰岛素分泌的 Pdx1 基因时,我们发现这种基因处于缺失状态,但其他 87 个基因围绕在它周围。其中一些缺失的基因,包括 Pdx1 基因,都是必不可少的,没有它们动物就无法存活。那么这些基因都在何处呢?
第一个线索是,在沙鼠的几个身体组织中,我们发现了受“缺失”基因指示而产生的化学产物,这只有在这些基因存在于基因组中的某个地方时才能实现。这就表明它们并不是真的缺失,只是隐藏起来了。
这些基因的 DNA 序列拥有大量的 G 分子和 C 分子,它们是构成 DNA 的四个“基本”分子中的两个。我们知道富含 GC 的序列会对某些 DNA 测序技术造成一些问题。与遗漏相比,我们难以探测我们想要寻找的基因,这使得发生这种情况的可能性更大。因此,我们将隐藏的序列称为“Dark DNA”,这参考了暗物质的名称。我们认为暗物质在宇宙构成中的比重约为 25%,但是,我们无法进行实际检测。
通过进一步研究沙鼠基因组,我们发现其中一部分基因组中的突变特别多,远远超过在其他啮齿动物基因组中发现的突变。现在,在这一突变热点内的所有基因都拥有富含 GC 分子的 DNA,而且这些基因都变得难以用标准的方法进行检测。过多的突变通常会阻止基因正常工作,但是不管怎样,尽管 DNA 序列发生了彻底的改变,沙鼠的基因仍能发挥它的作用。
这对基因来说是非常困难的任务。
以前曾在鸟类中发现了这种 Dark DNA。科学家发现,目前测序的鸟类基因组中缺失了 274 个基因。这些缺失基因包括瘦素基因(一种调节能量平衡的激素),科学家多年来都无法找到这种基因。这些基因也拥有非常高的 GC 含量,并且它们的产物存在于鸟体组织中,即便这些基因似乎在基因组序列中处于缺失状态。
什么是 Dark DNA?
大多数教科书对进化的定义表明它分为两个阶段:突变,然后就是自然选择。
DNA 突变是一个常见且连续的过程,完全随机发生。然后,自然选择用于确定突变是否会继续,这通常取决于它们是否带来了更高的繁殖成功率。总之,突变会造成生物 DNA 的变异,自然选择决定它是留下还是消失,所以自然选择影响了进化的方向。
但是,基因组内的高突变热点意味着某些位置的基因比其他的基因更易发生突变。这意味着,这样的热点可能是不受重视的机制,它也可能影响进化的方向,这表明自然选择可能不是唯一的推动力。
到目前为止,Dark DNA 似乎存在于两种非常多样化和完全不同类型的动物中。但是,我们现在还不清楚它的普遍程度。
所有的动物基因组都可以拥有 Dark DNA 么?如果不是这样的话,那是什么让沙鼠和鸟类如此的独特?亟待解决的,也最令人激动的迷题将会找出 Dark DNA 对动物进化有何影响。
在沙鼠的例子中,我们发现突变热点可能会使动物适应沙漠生活。但另一方面,突变可能会发生得非常快,以至于自然选择无法做出足够快速的反应来去除 DNA 中的有害物质。如果是这样,这意味着有害突变可以抑制沙鼠在沙漠之外的环境生存。
发现这样一个奇怪的现象肯定会引起关于基因组进化发展的各种问题,以及在现有基因组测序项目中有可能会遗漏什么的问题。也许我们需要回过头去再仔细观察一下。