南京农大构建世界首个植物重复基因数据库

南京农大构建世界首个植物重复基因数据库

图片说明:植物界不同类型重复基因含量分布及其随时间变化规律

2月21日,南京农业大学园艺学院教授张绍铃团队在国际著名学术期刊Genome Biology在线发表研究论文,系统鉴定了梨等141种植物基因组中不同类型重复基因,构建世界首个植物重复基因数据库,揭示重复基因进化的普遍规律。

植物在千百年的进化中,怎样变得越来越多姿多彩?一个重要因素就是植物会复制自己基因,丰富自己的基因库数量。团结起来力量大,多了自己的“同胞胎”兄弟姐妹,基因在生物体中就“声势”壮大了,不仅能抵御外界复杂多变的环境,还能增加进化变异机会,实现物种分化和多样性。

以往研究发现,有的植物有复制自己基因的功能,即通过不同类型复制方式产生一个与原基因序列相同的新基因。基因复制产生的两个同源基因称为重复基因或“姊妹基因”。近年来,越来越多的植物基因组被破译,目前已经完成全基因组测序的植物超过200种,但仍缺乏一个具有广泛适用性的鉴定不同种类植物重复基因的方法。

该团队前期系统鉴定梨基因组中重复基因的基础上,开发了一个具有普遍适用性的生物信息学方法(命名为DupGen_finder),用于鉴定植物界中不同种类植物基因组中的重复基因。深入分析141种植物基因组中重复基因含量随时间变化规律发现,基因串联复制和邻近复制在植物漫长的进化过程中始终保持较高的发生频率,为植物适应复杂多变的外界环境提供了源源不断的遗传变异材料。

同时该研究揭示,基因组加倍发生后的较短时间内,重复基因之间发生高频率的基因置换(geneconversion),随着时间的推移,重复基因之间会发生广泛的时空表达分化。最后,利用141种植物基因组中包含的所有蛋白序列构建了大规模的植物直系同源基因家族(86,831)。

此外,通过大规模收集整合国内外植物基因组数据资源,构建了世界首个植物重复基因数据库(PlantDGD,http://pdgd.njau.edu.cn:8080),目前已收录141种完成基因组测序的植物,包含大豆、水稻、小麦、玉米等大宗粮食作物,以及梨、桃、葡萄、蔬菜、花卉等园艺作物,并将拓展为植物相关的所有类别。该数据库将为深入研究重复基因的进化机制提供宝贵的数据资源。

该研究成果以南京农业大学为第一完成单位,园艺学院博士生乔鑫为论文第一作者,南京农业大学教授张绍铃和美国佐治亚大学教授Andrew H.Paterson为共同通讯作者;并得到了国家重点研发计划、国家自然科学基金重点项目、美国国家科学基金等项目的资助。

相关论文信息:DOI:10.1186/s13059-019-1650-2

;