Nucleic Acids Res:中科院北京基因所章张研究组等发表生命组学数据

摘要 : 2016年11月28日,国际核酸类重要学术期刊《Nucleic Acids Research》杂志在线发表了中国科学院北京基因组研究所生命与健康大数据中心章张研究组、赵文明研究组和肖景发研究组共同合作的题为The BIG Data Center: from deposition to integration to translation 的研究论文。

2016年11月28日,国际核酸类重要学术期刊《Nucleic Acids Research》杂志在线发表了中国科学院北京基因组研究所生命与健康大数据中心章张研究组、赵文明研究组和肖景发研究组共同合作的题为The BIG Data Center: from deposition to integration to translation 的研究论文。研究成果的发表是国内首次以数据中心为模式,整体发布我国生命组学数据资源建设情况,标志着生命与健康大数据中心建设取得实质性重要进展,也标志着我国建设综合性基因组数据资源获得国际同行认可。生命与健康大数据中心研究员章张、高级工程师赵文明以及研究员肖景发为该文共同通讯作者。

生命与健康大数据中心建成面向国家大数据发展战略的多层次生物组学数据资源系统,包括基于高通量测序的原始组学数据归档库(Genome Sequence Archive,GSA),围绕国家重要战略生物资源的基因组数据库(Genome Warehouse,GWH)、基于测序数据的基因表达数据库(Gene expression Nebulas,GEN)、基于中国人群以及国家重要物种群体的基因组变异数据库(Genome Variation Map,GVM)、基于全基因组DNA甲基化图谱的表观基因组数据库(Methylation Bank,MethBank)以及基于大众审编(Community Curation)的生命科学维基知识库(Science Wikis),初步形成我国生命与健康数据汇交与共享平台,具备可服务于全球的基因组数据共享网络。

国际三大数据中心(ncbi、EBI、DDBJ)对全球生物数据长期占据着主导地位,北京基因组所生命与健康大数据中心(BIG Data Center),作为北京基因组所的重要研究单元,承担相关公共数据库资源体系的研究与建设,面向我国人口健康和社会可持续发展的重大战略需求,围绕国家精准医学和重要战略生物资源的组学数据,建立海量生物组学大数据储存、整合与挖掘分析研究体系,发展组学大数据系统构建、挖掘与分析的新技术、新方法,建设组学大数据汇交、应用与共享平台。



The BIG Data Center: from deposition to integration to translation


Biological data are generated at unprecedentedly exponential rates, posing considerable challenges in big data deposition, integration and translation. The BIG Data Center, established at Beijing Institute of Genomics (BIG), Chinese Academy of sciences, provides a suite of database resources, including (i) Genome Sequence Archive, a data repository specialized for archiving raw sequence reads, (ii) Gene Expression Nebulas, a data portal of gene expression profiles based entirely on RNA-Seq data, (iii) Genome Variation Map, a comprehensive collection of genome variations for featured species, (iv) Genome Warehouse, a centralized resource housing genome-scale data with particular focus on economically important animals and plants, (v) Methylation Bank, an integrated database of whole-genome single-base resolution methylomes and (vi) Science Wikis, a central access point for biological wikis developed for community annotations. The BIG Data Center is dedicated to constructing and maintaining biological databases through big data integration and value-added curation, conducting basic research to translate big data into big knowledge and providing freely open access to a variety of data resources in support of worldwide research activities in both academia and industry. All of these resources are publicly available and can be found at

doi: 10.1093/nar/gkw1060

