Permanent Link a 首次有新网站披露了遗传样本的来源和收集时间
截止目前,在向公众公开的数据库中找不到关于何地、何时获取遗传数据的信息。然而这些关于采集生物样本的环境条件、地点、时间的信息对于比较世界范围内不同生境的生物多样性是至为关键的,并且对于生物多样性溯源来讲也是很关键。尽管我们在学术圈内多次呼吁要更多地公开类似数据,但时至今日,科学家都没有一个合适的工具来及时发布这些信息。
这个数据库的开发人员,在PLOS生物学杂志的文章中指出对于这些数据的标准化和保护将增加科研人员已经收集到的和正在收集的遗传序列数据的价值。例如,可以利用这些数据调查分析世界范围内某个特定维度的动植物的分布区域是如何随着气候变化而转移的,或者也可以评估在日益酸化的海洋环境中微生物群落的稳定性。
GeOMe的开发者包括史密森国家历史博物馆的Meyer, 加州州立大学蒙特利分校的Eric Crandall,CSUMB的Michelle Gaither,以及夏威夷海洋生物研究所的研究人员,伯克利自然历史博物馆的John Deck。
史密森研究所的动物学家Christopher Meyer协助构建了GeOMe数据库,他表示:“通过全球气候变化跟踪生物多样性的变化是一项共同合作的事业,无法凭一己之力独立完成。GeOMe将推动大数据以及未来科学发现,可让科学工作的收获远超过个体研究成果”。数据库开发团队致力于确保这些数据资源是易于使用,并且满足大范围使用的需求。学术界拥有了这种可免费获取的数据库和工具箱后,学术期刊现在就可以要求作者公布其文章中所利用的大数据的来源,且需要以类似于遗传序列数据的可搜索的标准模板公布。
分析生态标本的科学家,无论这些样本是植物的、动物的,抑或是从海洋、淡水、陆地生境中收集的整个微生物种群,都有自己的记录收集时间、地点的体系。但是,作为更广泛的学术界来讲,则难以去分享和获取这些信息,而且也是几乎不可能去全面搜索这些数据。对此,GeOMe提供了一个解决思路,即将收集样本的时间、环境、地理空间,以及由国家生物技术信息中心存储的遗传序列数据的学术背景永久地链接到此数据库上。
该数据库的另外一位开发人员Eric Crandall表示,我们花了大量时间,并且调动了很多资源去开发这个数据库,因为从一开始就知道这个数据库如果开发成功的话将会是一个提速科学发现的强大工具。基因序列数据是我们了解生物多样性本底的基础,但时至今日,都还没有一个数据库能将样本的环境和地理空间背景信息联系起来。此外,研究生物多样性的科学家花了大量时间和精力去开发基因组数据库,应该更为妥善的存储这些数据,以最大化其在重新利用和科学发现中的潜力。
GeOMe的成功开发是上述多个机构的研究人员和计算机科学家共同合作的成果,除上述机构外,还包括夏威夷海洋生物学研究所;生物条码(Biocode);Texas A&M University;University of California’s Gump South Pacific Research Station;French Polynesia; Berkeley Institute for Data Science at the University of California; University of Queensland in Australia。
在后续工作中,GeOMe数据库研究人员将采用统一模板对收集到的数据进行统一分类和调整,确保按照标准格式对生物样本信息进行整编,以最大程度地促进这些信息的再利用,最大化这些信息贡献于学术新发现的潜力。
此项研究的出资方主要包括:国家科学基金(the National Science Foundation), Gordon and Betty Moore Foundation;国家海洋和大气管理局(National Oceanic and Atmospheric Administration), NSF等。
原文链接:http://insider.si.edu/2017/08/first-new-website-reveals-origin-genetic-samples-time-collected/