种群基因组数据库,让你找到“家”的感觉

遗传资源、生物信息和基因数据,是维系一个民族生存与发展的命脉,世界各国都投入了大量资源建立国家基因库。荷兰国家基因库是欧洲基因库的一部分,为了丰富荷兰国家基因库的分子和表型数据,荷兰人基因组联盟联合华大基因开展了荷兰人基因组计划。荷兰人基因组计划通过对来自荷兰12个省份具有代表性的250个家庭进行全基因组测序(平均测序深度13×),一共鉴定出20.4M的单碱基变异、1.2M的InDel、一些复杂的结构变异和de novo突变并重建了单体型。荷兰人基因组计划阐明了人全基因组测序在构建群体变异数据库过程中的重要作用。

荷兰人基因组计划的诞生:

全基因组关联分析GWAS已经发现了成千上万与疾病、表型相关的变异,但是GWAS需要大量的样品、人群混杂且有大量假阳性和假阴性。专业的芯片也只能验证GWAS已经发现的变异位点,对于低频和稀有变异覆盖度不高。

2008年正式启动国际千人基因组计划,测序的人群包括非洲人、美洲人、欧洲人、亚洲人等种族,但是由于不同人种具有各自特有的基因变异模式,构建人种特有的数据库能让研究者更快地锁定与疾病相关的基因变异点,从而能够使用遗传信息更快地开发常见疾病的诊断、预防和治疗的策略。低频和罕见变异更可能是群体特异的变异信息,大规模的群体测序更有利于发现罕见和低频变异,从而为临床诊断提供依据。

荷兰是一个多民族国家,大于80%的人分布在中部和北部地区。荷兰人基因组计划启动于2010年,作为后人类基因组计划的一部分,就是为了构建群体特有的变异数据库。

实验设计:

样品选择:250个家庭(具体见下图)

表型数据:

研究成果:

1、发现了20.4M的SNVs,1.2M的InDel(小于20bp),27500个大的缺失(大于20bp)

2、在发现的SNVs中,6.2M是高频突变,4M是低频变异,10.2M是稀有变异

3、与参考序列基因型不同的SNVs中,有99.5%与基因分型结果一致

4、展示了荷兰人不同地区的人口迁移历史

5、随着父亲生育年龄的增加,后代de novo变异的频率会随之增加

a图展示的是12个省份荷兰人的分布图;b图展示的是PCA主成分分析人群的分类;

c图:血缘同源(IBD)的热图展示了古荷兰人一系列复杂的人群迁移历史(由南向北迁徙定居之后部分人群又开始了迁徙。)

荷兰人基因组计划的设计亮点:

样本选取具有代表性,首先人群是分布在荷兰全国各省,且是以家庭为单位,年龄从19-87岁,覆盖范围广。

表型数据全面,这样对于新的变异位点与疾病关系的研究提供了有参考价值的数据。

另外样本是外周血细胞DNA,没有经过体外培养,不会引入其他因素引起的突变。

此项研究证明了大样品量三口之家的方案设计以及中等深度的测序数据量对种群突变率的研究是一个行之有效的方法。

关联产品

华大科技人全基因组重测序产品现已全面升级,除了更贴近临床应用的肿瘤高级信息分析的升级优化,现隆重推出PVFD数据库(正常人群突变频率数据库)和BGI-GaP(基因型-表型数据库),PVFD数据库录入了人类全基因组范围内各位点的突变频率信息以及与变异数据相关的样本、表型和种族等重要内容,为您能筛选出真正致病的突变基因和位点提供依据。BGI-GaP提供了最全面的人类基因组-表型(突变-疾病)关系信息,可从中寻找遗传因素、健康状况、生活方式等特征与特定疾病的关系。

参考文献:

Dorret I Boomsma, CiscaWijmenga, Eline P Slagboom, et al. The Genome of the Netherlands: design, andproject goals. Eur J Hum Genet., 2014, 22(2):221-7.

Laurent C Francioli,Androniki Menelaou,Sara L Pulit,et al.Whole-genome sequence variation,population structure and demographic history of the Dutch population.NatGenet,2014 Jun 29,doi: 10.1038/ng.3021.

来源华大科技官方微信,转载请注明出处:

http://mp.weixin.qq.com/s?__biz=MjM5NzUyNzU2MA==&mid=200846711&idx=1&sn=c790a4ac5809356057539cd0389d88da#rd

;