基于长读长测序的中国人基因组拼接完成


6月30日,Nature communication发表了由暨南大学等单位的完成的基于长读长测序技术的中国人基因组的重头拼接工作。虽然通过短读长测序已完成了多个人类基因组的de novo拼接工作,但是对于基因组中的重复序列的拼接仍存在技术限制。暨南大学等机构的研究人员利用单分子实时测序技术(SMRT)对代号名为“HX1”的中国人基因组进行长读长测序。并通过纳米通道array构建物理图谱,获得了大小为2.93Gb (contig N50: 8.3Mb, scaffold N50: 22.0Mb, including 39.3MbN-bases)的基因组,以及206Mb alternative haplotypes。该研究对人类参考基因组GRCh38进行274个N-gap修补。与GRCh38相比,HX1中有12.8Mb的特有序列,其中包括4.1 Mb之前没有被报道过的亚洲人基因序列。此外,利用长读长测序发现了可变剪切产生的新基因,这些基因在GENCODE数据库里尚无注释,如果利用短读长RNA测序无法发现这些可变剪切位点。该研究结果暗示,如果想要更深入了解基因组功能变化需要针对不同人群使用一系列基因技术。

参考文献:Long-read sequencing and de novo assembly of a Chinese genome. Nature communication. 2016.

;