基因组研究揭示竹子异源多倍化历史和独特性状的遗传学线索
禾本科(禾草)是被子植物最大科之一,约有12000种,是水稻、小麦、玉米等人类粮食和牲畜饲料的主要来源,也为人类提供了加工淀粉、制糖、酿酒、造纸、编织和建筑等方面的重要原料。同时,禾本科又是植物遗传学和基因组学研究的模式类群。竹亚科(竹子)是禾本科的12个亚科之一,与早熟禾亚科、稻亚科组成BOP支系,是该科适应森林生境的一个主要分支。竹类植物多数种类植株高大、生长迅速,营养生长周期长达几十年,最长可达120年,且开花后即成片死亡。竹子作为“木质化的禾草”(woody grass)和独特开花性状而备受关注,但由于研究难度大,一直是禾本科研究的一个薄弱环节。竹亚科具有丰富的物种多样性,约有1500种,包括以染色体基数为12、不同倍性的四个分支,即二倍体的草本竹类(2n=20-24)、四倍体的温带木本竹类(2n=46-48)、四倍体的新热带木本竹类(2n=40-48),以及六倍体的旧热带木本竹类(2n=70-72)。然而,木本竹类与草本竹类、木本竹类3个分支间的关系,以及多倍化与木本竹类起源等问题都存在诸多疑问,其独特的生物学性状更有待研究。
中国科学院昆明植物研究所研究员李德铢带领的研究团队,长期以来致力于竹类植物分类、系统发育和演化研究。通过与中科院上海植物生理生态研究所、上海海洋大学等单位合作,依托国家重大科学基础设施——中国西南野生生物种质资源库,该团队在近期完成了基于全基因组测序的竹亚科“生命之网”及其独特生物学性状的比较基因组学研究。该研究获取了四种竹子的全基因组草图,代表竹亚科的主要分支和已知的所有染色体倍性(图1),分别是草本竹类的莪莉竹Olyra latifolia (Ola) 和Raddia guianensis (Rgu)、新热带木本竹类的瓜多竹Guadua angustifolia (Gan),以及旧热带木本竹类芸香竹Bonia amplexicaulis (Bam),其中芸香竹和莪莉竹为高质量的全基因组草图。同时,该团队还构建了旧热带木本竹类麻竹Dendrocalamus latiflorus的遗传图谱,这是竹亚科的第一个高密度遗传图谱。基于全基因组共线性分析,确认了竹亚科不同分支的染色体倍性,与前人的细胞遗传学研究结果相吻合。
针对木本竹子的多倍化起源问题,采用基于共线性的“完美拷贝”基因策略(与单拷贝核基因相比,具有与倍性完美匹配的拷贝数目),加上已发表的毛竹Phyllostachys edulis (Ped)基因组草图,分析了五种竹子的亚基因组和多倍化历史,揭示了竹亚科复杂的网状演化关系。结果表明,草本竹类在始新世中期(约四千二百万年前)与木本竹类的二倍体祖先开始分化;在中新世早期(约二千二百万年前),四个已灭绝的木本竹类二倍体祖先(分别命名为A, B, C, D)通过三次异源多倍化事件形成木本竹类的三大分支,其中B+C 和 C+D通过杂交和异源多倍化形成两个异源四倍体分支,即新热带木本竹类(以瓜多竹为代表,命名为BBCC)和温带木本竹类(以毛竹为代表,命名为CCDD);大约三百万年后,BBCC的四倍体祖先又与A亚基因组的祖先形成异源六倍体的旧热带木本竹类(以芸香竹为代表, 命名为AABBCC)(图2)。虽然分化时间的估算带有某种程度的不确定性,该研究暗示木本竹子的多样化可能与东亚季风的形成与强化有关。三大木本竹类分支共有一套C亚基因组,基于遗传图谱的共线性分析发现,该亚基因组表现出独特的基因组特征。来自该亚基因组的木质化相关基因在竹笋的发育中高表达并显著富集,显示其在竹子木质化过程中的关键作用。推断C亚基因组的二倍体祖先可能在当时已经具备了一定的木质化特征,获得了更高的适应优势,包含了它的异源多倍化竹子具有更佳的适应性而被选择下来,形成现存的木本竹类的三大分支。此外,对开花相关基因的比较基因组学分析发现,与同属BOP支系的模式植物水稻和同一亚科的草本竹类相比,SOC1基因在具有独特开花习性的木本竹类中发生了极大的结构变异(图3)。同时,木本竹类中OsPRR95/AtPRR9相关的基因多个拷贝受到正选择,赤霉素(GA)相关基因则发生显著的拷贝数变异,这些因素的综合作用可能导致了木本竹类独特的开花现象。
作为一个成功的案例,该研究可望推动禾本科的生物学与演化研究,对其它植物类群的多倍化起源研究也具有重要参考价值。研究结果近期以Genome sequences provide insights into the reticulate origin and unique traits of woody bamboos 为题在国际植物学期刊Molecular Plant 在线发表。昆明植物所研究员郭振华,博士马朋飞、杨国骞、胡金勇和刘云龙为论文共同第一作者,李德铢和上海海洋大学教授陆颖等为共同通讯作者。该研究得到中科院战略性先导科技专项(No. XDB31000000)、国家自然科学基金项目(No. 31430011和31670227)、云南省科技领军人才项目(No. 2017HA014)、中科院青年促进会(No. 2015321)、中国西南野生生物种质资源库开放项目(No. Y77P4412Z1)和中科院“百人计划”(No. 292015312D11035)的支持。
图1 用于该研究的5种竹子及其所代表的四大分支(物种缩写见正文)。
图2 木本竹子3个主要分支的异源多倍化模型(物种缩写见正文;Ma:百万年前)。
图3 竹子开花网络调控图及竹子中SOC1同源基因结构变异示意图。