华大基因在Beyond the Genome国际大会荣获生物医学中心开放数据奖

十一国庆期间,在美国旧金山举办的Beyond the Genome国际大会上,华大基因又获殊荣,荣获本年度生物医学中心开放数据奖(BioMed Central Open Data Award)。


华大基因

2013年10月1日,在美国旧金山举办的Beyond the Genome国际大会上,来自华大基因的科学家凭借其发现DNA甲基化存在于人类寄生虫——旋毛线形虫的研究成果,荣获了本年度生物医学中心开放数据奖(BioMed Central Open Data Award)。开放获取出版商BioMed Central是提供开放式访问的出版商,其开放数据奖授予那些在生物医学数据分享、标准化、发表及再利用等方面作出杰出贡献的作者。今年是BioMed Central第四次颁布此奖,而中国科学家则是首次获此殊荣。

这篇发表在《基因组生物学》(Genome Biology)杂志上的旋毛线形虫DNA甲基化文章彻底推翻了线虫不存在DNA甲基化现象的假说,这一研究成果震撼了整个表观组学届。这个微小的线虫是研究细胞和发育生物学的重要模式生物。作为一个饱含争议的新发现,旋毛线形虫DNA数据被存储在《Gigascience》的数据库——GigaDB中,以便于其他研究人员访问和再利用。

《基因组生物学》杂志的评委和编辑被作者在优化数据开放及访问等方面做出的巨大努力所折服,并强调开放重要科研数据的意义不只是提供一个资源,也为挑战不同科研结论赋予了透明度。除了将原始数据和转录组数据存储到GEO和SRA数据库中外,作者还在CCO公共域许可范围内对数据进行了特别的标准化处理,使所有公开可用的数据尽可能转化为可用格式。

作者们利用GigaDB来存储尚未建立存储库的相关联的数据类型,也会将数据以具备兼容性的ISA-Tab格式进行存储以实现利用最大化。当被问到完善数据格式的意义时,该研究负责人高飞指出:“当人们真正看到这些数据时,他们就会更有信心......到时候他们就可以自己去测试这些数据。”

GigaDB是新一代数据存储库,可以用来存储发表在新型“大数据”期刊《GigaScience》上的科研数据和相关研究工具,同时也为华大基因提供了一个以可引用格式快速发表数据的途径。在国家基因库的支持下,GigaDB最近进行了升级,有助于满足国家基因库和华大基因关于资源共享和科研交流的需求。作为DataCite委员会的成员以及合伙人,数据库还设置了数字对象标识符,使数据可以被独立引用。

在此次会议上,除了荣获BioMed Central开放数据奖外,华大基因子公司——华大科技的执行总裁李英睿是大会组委会成员,华大研究人员还就华大基因在产前诊断和生育健康方面的前沿性研究给参会的科学家们做了生动的主题演讲。

;