国家基因库参与沙鼠基因组研究 最新成果发表于PNAS

2017年7月4号,由牛津大学,深圳国家基因库生物多样性基因组研究课题组和丹麦诺和诺德公司合作完成的沙鼠(Psammomys obesus)基因组最新研究成果发表于PNAS。该研究文章公布了高质量的沙鼠基因组图谱,并通过对沙鼠基因组中重点区域的分析揭示了沙鼠易患糖尿病的遗传机制。

沙鼠是目前少有的可以作为研究二型糖尿病的模式生物,是沙鼠亚科 Gerbillinae 的一个成员,生活在极端的荒漠环境中。长期对缺水和食物极端环境的适应影响了沙鼠对糖分代谢能力。对沙鼠进行高糖分食物喂养,会使沙鼠容易肥胖,发展出糖尿病相关特征,导致胰腺衰竭甚至死亡。PDX1是胰岛细胞中表达的基因,参与调控胰岛素分泌和其他胰岛激素基因作用。在之前的研究中,研究人员并未在沙鼠及其同一亚科(Gerbillinae)的物种中找到PDX1基因,却在该亚科最邻近的物种非洲刺毛鼠(Acomys cahirinus)发现了这个基因。因此,研究人员猜测沙鼠亚科的物种在演化过程中丢失了这个基因,从而使沙鼠变得对糖尿病易感。但在进一步的研究中,发现这个基因跟胚胎中的胰腺发育相关,在小鼠中剔除这个基因会使小鼠在生长中因胰腺缺失而导致死亡,所以也有不少学者推测沙鼠不可能丢失该基因。

为了解决以上问题,揭示沙鼠获得糖尿病的机制,研究人员对沙鼠基因组进行测序, 同时对沙鼠的肝脏、胰腺与十二指肠组织进行了转录组分析。研究人员在初始组装的基因组版本中并未找到PDX1及其附近的共88个基因,但是在转录组中却识别出了同源序列,而且转录组中PDX1及其他在基因组丢失的基因序列的GC含量都异乎寻常的高,这一结果暗示了在基因组上未能识别的这些序列可能是由于高 GC 含量导致的偏差造成的。因此研究人员进一步分离出了高GC含量的基因组区域,并用Miseq对这段区域进行加测和重新对基因组进行组装,最终在重新组装的基因组中找到了PDX1基因及其附近的其他基因。

通过对沙鼠PDX1功能域的60个氨基酸与其他脊椎动物比较,发现这个基因在沙鼠演化过程中发生了极其快速的变化,演化出跟其他物种完全不同的15个氨基酸位点,同时这个基因两端也存在多个片段缺失。研究人员计算了小鼠与沙鼠/人与沙鼠 1:1 直系同源序列的蛋白偏离指数(PDI),结果表明,大部分沙鼠的基因序列与小鼠和人都有很高的相似度,但Pdx1 序列的差异度最高。在蛋白偏离指数前 10的序列中有7个序列在 GC突变热点区域,暗示GC偏向性突变对这一区域编码序列的差异有重要的影响。研究人员推测,这一高度偏向性的突变造成了沙鼠中 Pdx1基因的高GC含量,这一特征对于该基因调控胰岛素和其他胰腺基因的转录可能有重要的影响。进一步的功能实验表明,这种GC偏好变异对于沙鼠乃至整个沙鼠科物种在干旱与低能量摄入的环境下,提高糖代谢效率具有重要作用。这也很好地解释了沙鼠为何在喂食高热量食物后容易产生糖尿病的现象。

扩展阅读:

Genome sequence of a diabetes-prone rodent reveals a mutation hotspot around the ParaHox gene cluster

;