数据平台让水稻更易“读懂” 以水稻为研究对象的数据库
水稻生物学数据库众多、信息量大,但大多是生物学原始数据;国内传统种质资源数据库鲜有二次开发功能;国内缺少整合多学科数据的集成性数据库……如何从海量数据中挖掘有用信息提供给农业科研工作者,一直是个难题。中国水稻研究所鄂志国、王磊、庄杰云等创建了“国家水稻数据中心”(http://www.ricedata.cn/),让难题迎刃而解。
经过10多年的建设,该平台已发展成为一个以水稻为研究对象,融贯多学科的综合性数据库。其所载内容已被他人引用超过350次,它以网站形式为用户提供信息,日访问IP数超过500个,在国内外农学类信息系统中,访问量名列前茅。
据悉,研究人员开发系谱数,创建中国水稻品种及其系谱数据库,收录国内外水稻品种和育种材料等数据近1.5万份;构建优异稻种资源数据集和大品种指纹数据集,收集优异稻种资源数据共计5379份。
“本数据库是国内有关水稻品种资料最全,且唯一带有系谱追溯功能的数据库。”中国水稻研究所教授鄂志国说,在系谱追溯分析基础上,研究人员提出“骨干亲本”评价方法,即对同时代育成的种质和同样的衍生世代进行量化比较,有助于育种家高效选择亲本。
科研人员还创建水稻功能基因数据库,以文献析出的方式整合了国内外报道的水稻功能基因2545个;开发出基于浏览器的遗传图谱生成程序和基因结构图生成程序,并对水稻产量关键性状相关数量性状基因座(QTL)进行图谱整合。
这一平台收录水稻相关术语2300多条,开创性地将此系统应用于水稻功能基因数据库和参考文献数据库的管理;将不同学科数据进行有机整合,有助于节省科研人员的跨平台检索时间,提高了效率。
截至目前,该数据库还为国内有需求的科研与教学单位无偿提供“目标种质衍生后代批量查询”等专项科技服务,帮助育种家评判目标种质在育种中的利用价值,高效选择亲本。