Sci Rep:国内首个基于消费级基因数据构建的中国人高精度父系祖源图谱发表
近日,Nature 出版集团旗下期刊 Scientific Reports 在线发表了来自 WeGene、中南大学,德国马普研究所的研究人员取得的最新研究成果。该工作基于来自消费级基因检测的 2139 名中国男性 Y 染色体数据,构建了更高精度的中国人父系祖源图谱。
对于人类基因组来说,Y 染色体是决定人类性别的染色体,因其只在男性中出现,而且不会有同源重组现象,可以忠实地保留父系信息,在分子人类学中,对研究人类的起源和迁徙有着重要意义。
文章第一作者,WeGene 生物信息专家姚笑天表示:现有的 Y 染色体已经成为人类走出非洲,并迁徙至世界各地的重要证据。目前,欧美人群的 Y 染色体精细谱系树已有较为系统、详尽的研究,而关于中国人的父系图谱的内部分枝结构的研究还有很多欠缺。
文章通讯作者王传超博士在复旦大学时师从国内分子人类学专家金力院士和李辉教授,现在德国马普研究所和哈佛医学院遗传学系继续从事分子人类学和古 DNA 方面的研究工作。王传超博士表示:随着高通量测序技术的应用,近年来在 Y 染色体上发现了数万个可能具有谱系识别力的 SNP 位点,但使用普通 PCR 和 SNaPshot 技术对这些位点的进一步验证和谱系定位却是耗时耗力、花费巨大。鉴于此,我们跟 WeGene 的生物信息团队一起设计了包含大量 Y 染色体、线粒体及其他常染色体上的共 60 万高质量位点的基因芯片。以数万中国人基因组数据为基础,构建、完善了东亚人群的高精度 Y 染色体谱系树。这对于理清中华民族的起源、迁徙和融合历史、法医身源鉴定等都有重要意义。
这项研究中,研究团队重点关注了 O2a1c-002611 这一 Y 染色体单倍群,利用 WeGene 芯片所涵盖的 Y 染色体上近两万个 SNP 的分型结果,找到了 89 个具有谱系鉴别力的 SNP 位点,并对 O2a1c-002611 进行了更精细的重构。根据新的单倍群树,其下游的 O2a1c1a-F11 在中国的汉族中经历了一次大的扩张,在现代汉族中占了高达 11.13% 的比例,并可以细分为 7 个更细的分支,比例占 0.187% 到 3.553% 不等。这一结果结合 O2a1c-002611 在藏缅等族群中的分布情况,将有助于研究人员进一步深入研究汉藏族群的起源和迁徙历程,对语言的起源和多样化研究也能起到参考作用。
据悉,这是第一篇基于消费级基因检测数据的中国人群基因组学研究论文。在此之前,美国的 23andme 等直接面向消费者基因检测公司已经基于所积累的大量基因组数据在 Nature Biotechnology 等诸多顶级期刊上发表多篇关于饮食喜好、抑郁症、遗传病等领域的论文。
王传超博士表示,这一研究是依托 WeGene 近年来所积累的大量用户的基因组数据库,进行中国人基因组相关科学研究的一个新探索。我们成功地将在中国人中高频出现的 O2a1c-002611 单倍群的内部结构进行了高精度的构建。未来我们会继续基于这个模式,探索与中国人群有关的重要分子人类学问题。
文章另一位通讯作者、 WeGene 首席技术官陈钢博士表示:WeGene 通过与赛默飞、DNA Genotek、华大科技等全球一流的合作伙伴一起努力,在 DNA 样品质量、基因组数据质量等方面投入巨大,目的就是为了在确保用户得到可靠的检测结果的同时,还能让这些基因组数据在用户知情同意的情况下为中国人的基因组学研究作出贡献。
据悉,除了分子人类学方面的研究项目,WeGene 也正与上海交通大学、济宁医学院等机构开展关于尼古丁成瘾易感性、酒精成瘾易感性、女性痛经遗传因素等研究合作项目。