大数据杂志《GigaScience》正式发刊

华大基因,2012-07-17

7月12日,华大基因和生物医学中心(BioMed Central)宣布其共同创办的生物学期刊《GigaScience》首刊正式发行。该期刊采用标准全文文献、数据库信息以及信息分析工具相结合的崭新模式,来发表大规模的生物学研究成果,为广大科研工作者提供免费公开的有效数据以及生物学发现等资源。《GigaScience》的正式发行是传统期刊出版业迈向数据全面公开与共享的重要一步,有助于实现科研人员对数据资源最大可能的合理利用,提高数据密集型科研项目的再现性

《GigaScience》杂志这种全新的出版模式使读者不仅可以着眼于文献中所得到的科学结论,还可直接通过文献所提供的数据和分析工具对结果进行测试和验证,实现了数据的透明、公开及再现性,为克服目前研究成果普遍缺乏可重复性的问题提供了一条很好的解决途径,同时对充分挖掘数据的生物学价值也具有十分重要的意义。与《GigaScience》杂志相结合的大型数据库GigaDB(http://GigaDB.org)已采用数字对象唯一标识符(DOIs)对杂志数据库中的所有数据进行标识,使数据保存更加永久,实现可追踪、可检索、可链接、可引用,而之前这些功能仅能用于学术文献。实现数据的可引用性,可以使提供和分享这些数据的研究人员为他们所做出的科研成果获得更应有的认可。

以本期中英国伦敦大学学院(University College London)Stephan Beck教授领导的研究小组的研究论文(http://goo.gl/2nZgD)为例来说明《GigaScience》和GigaDB数据库在出版方面所进行的革新性举措。这篇文章聚焦于DNA甲基化的全基因组分析。文章包含了所有的支撑数据和重现该实验所需的软件工具,共84GB数据量,均可从GigaDB上免费获取及使用。依托华大基因的数据存储能力,《GigaScience》完全能够有效管理这些远超过其他任何期刊所能出版管理的数据信息容量。此外,GigaDB将进一步通过采用零版权声明的方式来放弃所有数据信息的版权,以支持数据的完全公开访问与便捷获取。

主编Laurie Goodman指出:“目前,海量数据的使用能力远远落后于数据的产出能力。华大基因的领导者们首先意识到创办这种全新期刊的必要性,通过华大基因强大的计算信息资源,可以使海量数据信息得以存储及管理,并使数据资源可直接被链接及引用到科研论文中。此外,通过在数据平台中涵盖分析工具,以及下半年将增加的强大云计算技术,《GicaScience》将能够把数据信息直接共享给缺乏强大计算资源但需要最优数据的研究人员。这也和我们的合作出版方BioMed Central的目标是一致的,从而使得我们在这项计划中成为彼此最佳的合作伙伴。”

在这种大数据导向的创新发表模式下,《GicaScience》还将发表综述和评论文章,对未来更好的处理大数据所面临的挑战和困难提出见解。

;