长读长测序组装大猩猩基因组

应用基因测序技术的最新进展,研究人员显著改善了先前对大猩猩基因组的组装。为了更好地理解人类生物学和基因变异,拥有与我们有着最近亲缘的非人类灵长类基因组的完整、高品质数据颇为重要。

第一个大猩猩的全部基因组是在2012年被测序的。然而,该基因组含有超过40万个基因序列空白,且先前的基因组组装方法导致了一些不准确的基因结构。

为此,David Gordon等人用长读测序技术连同一个独特的算法组合来重构一种准确得多的大猩猩基因组,他们所用的DNA是从芝加哥林肯动物园内的一个名叫苏茜(Susie)的西部低地大猩猩的体内分离得到的。

与先前的大猩猩基因组装配(gorGor3)相比,这种新装配(Susie3)的重叠群减少了96%,重叠群指的在基因组内可能缺乏其定位信息的短序列。

同样地,作者们说,对于gorGor3基因组中的43万3861个序列空白,他们已经填补了94%。为了更好地了解这些物种中的基因变异,该团队使用了来自其它6个西部低地大猩猩的短读序列。将Susie3和人类基因组装配进行比较揭示了总共有11万7512个插入和删除及697个倒位变异株。这些事件中有超过86%是先前未被发现的。

这些结果就我们这个物种与我们的非人类表亲间的基因变异提供了更好的理解,而且还展示了对其它哺乳动物基因组进行更高精度测序的方法。

参考文献:David Gordon, John Huddleston,, Chen-Shan Chin, Evan E.Eichler. Long-read sequence assembly of the gorilla genome. Science,01 Apr 2016. Vol.352, Issue 6281. DOI:10.1126/science.aae0344

本文来源于:生物360

欢迎关注中科紫鑫人事招聘相关信息:http://www.ngscn.com/index.php/Job/employ

;