DNA Res:中外科学家合作发表油棕基因组学研究进展

摘要 : 近日,国际基因组学领域重要期刊《DNA Research》杂志上在线发表了中国科学院微生物所叶健青年课题组联合新加坡淡马锡生命科学研究院岳根华教授和美国洛克菲勒大学蔡南海教授实验室等单位的国际研究小组的一篇研究论文

近日,国际基因组学领域重要期刊《DNA Research》杂志上在线发表了中国科学院微生物所叶健青年课题组联合新加坡淡马锡生命科学研究院岳根华教授和美国洛克菲勒大学蔡南海教授实验室等单位的国际研究小组的一篇研究论文,论文报道了科研人员完成了高产母本厚壳Dura基因组的高质量的序列测定和多个种质资源的基因组重测序以及进化分析。叶健课题组的孙艳伟助理研究员为文章的共同第一作者之一,叶健和中国科学院外籍院士、和为文章的共同通讯作者。

油棕(Elaeis guineensis)属多年生单子叶植物,是世界上产油率最高的热带木本油料作物之一,以5%的种植面积生产世界上45%的植物食用油脂,单位种植面积产油量是主要油料作物大豆的13.2倍,享有“世界油王”之称。棕榈油还是生物燃料的理想原料来源,投入产出比可观,产出的能量是栽培所需消耗能量的9倍。我国是全球棕榈油最大的消费国之一,几乎全部依靠进口,进口量约600万吨。因此,合理利用国土资源,发展油棕产业并完善其产业链,是解决我国在植物食用油脂高度依赖进口的问题的重要出路之一。最近国际绿色和平组织等环保组织抗议最大棕榈油生产和出口国—印度尼西亚和马来西亚的油棕生产和出口,其出口能力正受到严格控制。为应对国外主产地的种植面积受限的态势,我国迫切需要加快油棕产业和基础科研的发展,并积极开拓海外种植基地,保障棕榈油进口的需求。

油棕育种周期长达20年一代,在该领域我国的发展比较落后,世界上过去100多年来也是通过普通遗传育种进行品种培育。按果壳形式分,油棕包括3种主要品种形式:厚果壳(Dura)、无壳(Pisifera)和前两者的杂交后代薄壳油棕(Tenera)(图1)。无壳品系Pisifera纯合不育,胚发育早期致死,产量较低,商业上无大面积推广。厚果壳(Dura)为商业上主要推广品种。而由于油棕种质资源匮乏,导致商业用品种遗传背景单一,抗源缺乏,狭长孢灵芝(Ganoderma boninense)等大型真菌病害引起的根腐和茎腐病造成大片轮作油棕地块毁园绝收的严重病害流行。而且目前由于其基因组数据缺乏,无法应用现代育种技术,大大限制了抗病育种工作的进行。

项目组从2013年开始相关研究。该项目采用第二代高通量测序技术,对东南亚重要的高产母本厚壳Dura材料进行全基因组随机测序,组装出1.701Gb、覆盖基因组95%以上区域的高质量序列草图,并且对油棕主要组织器官进行深度转录组测序,注释出近36,105个高度可靠的油棕基因。由此建立的基因表达谱,覆盖了油棕大部分的自然生长阶段,特别是包括了受狭长孢灵芝侵染不同阶段的油棕根部基因表达数据,为油脂合成及调控基因功能研究和抗病高产育种提供了重要基因组和表达谱分析数据。通过对其他来源于非洲和美洲不同区域的油棕Dura品种的再测序,获得了1800万个SNP(单碱基多态性位点),并在基因组中定位了其中的1万个SNP分子标记。在油棕基因组中鉴定出了566个抗性基因(R基因),与已经测序的植物基因组中含有的抗性基因的数目相比要少,仅为水稻(基因组为373M,只有油棕基因组的2%大小)的1/2,且大量的抗性基因在进化中受到了正选择 (positive selection) 作用, 特别是含有NBS-LRR结构的两类抗性基因(TIR-NBS-LRR和CC-NBS-LRR)的非同义突变/同义突变(Ka/Ks)比值分别高达3.5和2.5,说明这两类抗性基因在油棕的不同地理区域抗性适应过程中发挥了重要作用。本研究成果为油棕分子辅助育种和基因组编辑抗性育种工作奠定了坚实基础,对日趋竞争激烈的全球食用油、生物燃料生产和保护热带雨林等产生积极的影响和作用,对保障我国的食用油安全具有重要意义。

原文链接:

Draft genome sequence of an elite Dura palm and whole-genome patterns of DNA variation in oil palm

原文摘要:

Oil palm is the world’s leading source of vegetable oil and fat. Dura, Pisifera and Tenera are three forms of oil palm. The genome sequence ofPisifera is available whereas the Dura form has not been sequenced yet. We sequenced the genome of one elite Dura palm, and re-sequenced 17 palm genomes. The assemble genome sequence of the elite Dura tree contained 10,971 scaffolds and was 1.701 Gb in length, covering 94.49% of the oil palm genome. 36,105 genes were predicted. Re-sequencing of 17 additional palm trees identified 18.1 million SNPs. We found high genetic variation among palms from different geographical regions, but lower variation among Southeast Asian Dura and Pisifera palms. We mapped 10,000 SNPs on the linkage map of oil palm. In addition, high linkage disequilibrium (LD) was detected in the oil palms used in breeding populations of Southeast Asia, suggesting that LD mapping is likely to be practical in this important oil crop. Our data provide a valuable resource for accelerating genetic improvement and studying the mechanism underlying phenotypic variations of important oil palm traits.

doi: 10.1093/dnares/dsw036

作者:叶健

;