众包个体基因数据库缓慢发展
Yaniv Erlich 图片来源:Timothy Lee
计算遗传学家Yaniv Erlich因其建立了世界最大“家谱”而引人注目。而目前,他的DNA.land又引发新一轮个体基因数据库“众包热潮”。
早在2013 年,Erlich 团队就发表了一篇论文,介绍了如何利用公共资源,通过交叉比对的方法确定遗传学研究参与者的个人身份。
之前研究发现,人们“遗留”在各个数据库里的匿名遗传学信息会泄露他们的真实身份信息,只需要将这些数据与个人的 DNA 进行一下比对就可以了。而且 Erlich 发现,只需要连上互联网就足以完成这一切工作。之后,该研究组还将1300万人的系谱信息结合到一棵家庭树上。
去年,Erlich与合作者、哥伦比亚大学的Joe Pickrell邀请在23andMe和Ancestry.com等商业基因公司测试过DNA的人,分享自己的DNA报告用于研究。Erlich提到,DNA.land将收入已经寄出唾液样本进行检测的300万参与者的基因数据。
与企业不同,DNA.land将取得参与者同意,将他们的个人信息向研究人员开放。本月,DNA.land已经有3.2万注册参与者。Erlich近日在美国人类遗传学年会上报告了自己的成果,并表示,尽管不足100万人,但他仍认为该项目走上了正轨且进入了新领地。
“与其他试图众包DNA或人体材料的项目相比,我认为我们已经取得了很多成功。你需要花时间建立动量。”Erlich说。而目前,DNA.land的资料已经被用于研究,他的团队已经发表了一篇基于MinION 测序的bioRxiv论文。“我们使用DNA.land作为扫描大群体的方法,以判断能否确定单独的个体,像我或Joe。”Erlich说。
下一步,Erlich计划探索能否众包人们的脸书网档案。通常,获得外表型(例如性格等)更困难。在一篇发表于美国《国家科学院院刊》上的研究中,研究人员基于你的喜好,就能获得你的5大人格特性。