PNAS:首个“现代蛙类”基因组被成功破译
2015年3月3日,来自中科院昆明动物所和深圳华大基因国家基因库的研究人员成功破译了高山倭蛙基因组,这是迄今为止破译的首个现代蛙类基因组,也是目前破译的第二个两栖动物的基因组。为两栖动物进化研究提供了新线索。相关研究成果在美国科学院院刊(PNAS)杂志在线发表。
两栖动物是脊椎动物的一个重要分支,目前已知的包括7000多个物种,代表着脊椎动物从水生到陆生这一伟大转变的过渡类群。在研究脊椎动物的进化及其背后的分子机制中处在非常关键的位置。随着基因组测序技术和生物信息分析工具的快速发展,大量的基因组被成功解析。然而对于两栖动物这一重要的生物类群,目前仅测序完成了一个物种:非洲爪蟾。非洲爪蟾属于“古老蛙类”(Archaeobatrachia)的一种,而大部分(95%以上)的蛙类属于“现代蛙类”(Neobatrachia)。这在一定程度上限制了我们对两栖动物基因组特性的认识。这就迫切需要破译一个“现代蛙类”的基因组。
在本研究中,来自昆明动物所张亚平院士和车静课题组的孙艳波,和华大基因研究院国家基因库生物多样性张国捷博士课题组的熊子军和向薛雁共同合作完成高山蛙的样品收集、测序组装注释,以及后续的比较基因组学分析。高山倭蛙是青藏高原的土著物种,同时也是青藏高原上的绝对优势种,具有广泛的地理分布,因此,该基因组的破译同时也为研究该物种的高海拔适应提供了良好的研究基础。研究人员通过高山倭蛙和非洲爪蟾基因组比较分析发现高山倭蛙拥有更大的基因组,比非洲爪蟾多了近800M的基因组序列(高山倭蛙基因组2.3G,非洲爪蟾1.5G)。这种基因组大小的差异主要是由于两者的转座元件含量不同导致的。另外,高山倭蛙的转座元件主要以长末端重复序列(LTR)为主,而非洲爪蟾则是以DNA转座子(transposons)为主。相对于非洲爪蟾,高山倭蛙中的LTR具有更高的保守性。研究人员进一步分析了转座元件的在基因组的分布关联情况,发现两物种的转座元件分布模式差异很大。
通过对全基因组数据分析,研究人员推算出高山倭蛙和非洲爪蟾的分歧时间大约在2.66亿年之前,比TimeTree项目记录的时间要早了4千万年。尽管两物种分歧时间很久,但是它们染色体间的重排特别少,说明蛙类基因组可能具有相对较慢的进化速率。进一步研究发现,在染色体内部重排速率、基因区和全基因组范围的替换速率,蛙类都比鸟类和哺乳类动物要低。揭示了两栖动物,甚至整个冷血动物,具有比恒温动物更低的进化速率。通过构建四足动物祖先染色体发现,尽管四足动物有3.6亿年的进化史,在人的染色体中仍然可以看到较长的祖先序列被完整地保留下来。通过分析染色体断裂,融合事件,发现人的染色体间重排最剧烈,鸡和两栖动物染色体间重排相对较少。高山倭蛙基因组的破译,使我们进一步确认了更多的人类、鸟类、甚至蛙类基因组中的染色体断裂和融合区域,同时通过高山蛙基因组序列鉴定出了3个非洲爪蟾特有的重排事件。“这是首次在全基因组范围内比较两栖动物内部的替换速率和重排速率,通过对蛙类基因组的测序和比较分析,我们可以对两栖动物的进化有更多的了解。”来自国家基因库生物多样性课题组的共同第一作者熊子军说道。
此外研究人员还发现两栖动物特有的高度保守区显著富集在RNA翻译调控功能上。其中两栖动物特有的高度保守的三个基因是和舌头发育相关。舌头在蛙类中形态已经高度特化,可以用来快速扑捉昆虫和其它猎物。这些基因很可能在两栖动物进化中发挥着重要的作用,即便是非洲爪蟾已经退化不含舌头,但是这些基因依然非常保守。
The development of efficient sequencing techniques has resulted in large numbers of genomes being available for evolutionary studies. However, only one genome is available for all amphibians, that ofXenopus tropicalis, which is distantly related from the majority of frogs. More than 96% of frogs belong to the Neobatrachia, and no genome exists for this group. This dearth of amphibian genomes greatly restricts genomic studies of amphibians and, more generally, our understanding of tetrapod genome evolution. To fill this gap, we provide the de novo genome of a Tibetan Plateau frog, Nanorana parkeri, and compare it to that of X. tropicalis and other vertebrates. This genome encodes more than 20,000 protein-coding genes, a number similar to that of Xenopus. Although the genome size of Nanorana is considerably larger than that of Xenopus (2.3 vs. 1.5 Gb), most of the difference is due to the respective number of transposable elements in the two genomes. The two frogs exhibit considerable conserved whole-genome synteny despite having diverged approximately 266 Ma, indicating a slow rate of DNA structural evolution in anurans. Multigenome synteny blocks further show that amphibians have fewer interchromosomal rearrangements than mammals but have a comparable rate of intrachromosomal rearrangements. Our analysis also identifies 11 Mb of anuran-specific highly conserved elements that will be useful for comparative genomic analyses of frogs. The Nanorana genome offers an improved understanding of evolution of tetrapod genomes and also provides a genomic reference for other evolutionary studies.
doi: 10.1073/PNAS.1501764112
作者:Yan-Bo Sun