打通“信息孤岛” 实现玉米多组学数据“云端”集成检索分析
南湖新闻网讯(通讯员 桂松涛 陈锦)玉米是我国最重要的农作物之一,总产量和种植面积跃居全国第一。近年来,我国玉米基础研究起步晚、进步快,取得了显著成绩。特别是随着高通量检测技术的快速发展,玉米相关的生物学数据朝着多组学、多维度的层面快速积累。但我国学者对基础研究的材料和数据的收集和分享长期依赖国际数据库,国内玉米研究的材料和数据的共享平台亟待加强。同时,现有的玉米数据库大多关注一种或特定几种组学数据,不同数据库之间难以有效整合利用,形成了一个个“信息孤岛”。
近日,我校严建兵教授课题组成功整合了来自于同一玉米群体的基因组、转录组、表型组、代谢组、表观基因组、遗传变异以及遗传定位结果等多组学数据,构建了一个玉米属综合数据库ZEAMAP(http://www.zeamap.com/),并内嵌了基因组“浏览器”和“搜索引擎”,实现对相关组学数据的高度集成、快速检索和智能分析。
该数据库以严建兵课题组牵头收集并被国内外同行广泛使用的玉米关联群体为基础(据不完全统计,该群体已经被超过60个国内外实验室所使用,严建兵课题组已分发的材料多达15000余份,已经产生了大量的各类数据和成果),收集整合了该群体的基因组、转录组、表型组、代谢组、表观基因组、遗传变异以及遗传定位结果等多组学数据,构建了一个玉米属综合数据库ZEAMAP。该数据库同时收录了4个玉米基因组和1个大刍草基因组,并进行了详细的功能注释,内嵌了基因组“浏览器”以及丰富的数据检索、分析和展示工具,可以直观地对比较基因组、基因共线性区块、表达模式聚类、遗传变异基因型、连锁图谱、遗传定位结果、染色质交互、组蛋白修饰以及群体水平的DNA甲基化等多组学数据进行检索和分析,并提供相应的条目链接,实现在不同组学数据之间进行跳转访问。
严建兵课题组表示,将持续维护和更新该数据库,开放共享数据和材料,欢迎广大科研工作者使用并提改进意见。并期待这一云端集成检索有效促进对玉米现有组学数据资源的利用,有助于深入理解玉米遗传变异、表型和基因之间的关系,辅助玉米的遗传育种和改良,共同促进科学事业的发展。
相关成果以“ZEAMAP,a Comprehensive DatabaseAdapted to the Maize Multi-Omics Era”为题发表在iScience杂志。我校植物科学技术学院博士后桂松涛博士为论文第一作者,植物科学技术学院严建兵教授和博士后杨宁博士为论文通讯作者。我校作物改良国家重点实验室以及深圳华大基因科技服务有限公司对该研究的开展提供了大力支持。该研究得到了国家重点研发计划和国家自然科学基金的资助。
论文链接:https://www.cell.com/iscience/fulltext/S2589-0042(20)30426-0