华大基因组装完成迄今最完整的人类单倍体水平的二倍体基因组序列

2015年5月26日,华大基因研究人员首次基于新一代测序技术,开发策略和方法组装出迄今最完整的单倍体水平的二倍体基因组序列,为从头组装杂合度高的基因组奠定了基础。最新研究成果发表于《自然生物技术》。

人类基因组是二倍体,完整了解每个染色单体的变异对基因组信息的解读具有重要意义。在本研究中,研究人员在不使用参考基因组序列的前提下,仅凭借新一代测序(NGS),通过全基因组鸟枪测序法(WGS)结合Fosmid-pooling策略的分级组装方法,组装出人类单倍体水平的二倍体基因组。

研究人员通过所开发的方法对之前已完成的第一个亚洲人基因组 YH 1号进行重新测序,组装出5.15Gb的二倍体基因组序列,其单体型N50长度达到484 kb。本研究首次全面分析和展示了人类二倍体基因组完整的序列和变异信息,包括之前研究中很难或者无法发现的新序列或基因以及中等长度的杂合插入和缺失突变(51~200bp),并揭示了他们在生物学上的作用。

人类单倍体水平的二倍体基因组信息对于解读基因型与表型之间的关系具有重要价值。此次完成的二倍体基因组是迄今最完整的从头组装结果。研究所采用的YH 1号有着完整的基因组、转录组、甲基化数据和细胞系。因此,该研究可以为将来新测序和组装技术的研发以及涉及到RNA或蛋白生物学功能研究提供重要的标准和基础。

华大基因该项目负责人曹红志表示,通过对基因组信息的全面分析,本研究揭示了个人完整基因组信息对于解读基因型与表型相互关系的重要价值,从而更加科学,准确的指导个体化医疗。此外,研究开发的策略为杂合度高或多倍体基因组参考序列的组装提供了解决方案。

;