中国科学家揭示染色质修饰调控植物基因表达的新机制

2018年8月6日,中科院分子植物科学卓越创新中心/植物生理生态研究所植物逆境生物学研究中心植物分子遗传国家重点实验室何跃辉研究组(与刘仁义研究组合作)和杜嘉木研究组(与美国威斯康辛大学钟雪花研究组合作)在Nature Genetics背靠背分别发表题为Polycomb-mediated gene silencing by the BAH-EMF1 complex in plants和EBS is a bivalent histone reader that regulates floral phase transition in Arabidopsis的研究论文。两篇文章利用生化、分子、遗传、组学及结构生物学等研究方法,分别揭示了植物特有染色质凝缩蛋白EMF1与含BAH结构域的SHL和EBS形成BAH-EMF1复合体而介导植物基因沉默的分子机制,以及二价组蛋白标记阅读器EBS在拟南芥开花时间调控中的作用机制。

组蛋白赖氨酸的甲基化修饰在真核生物基因表达调控中的作用广泛,是一种重要的调控方式。其中组蛋白H3第4位赖氨酸的三甲基化(H3K4me3)修饰通常与基因活性表达关联,而H3第27位赖氨酸的三甲基化(H3K27me3)修饰则与之拮抗,抑制基因表达。H3K27me3修饰由Polycomb蛋白家族(PcG)介导。多细胞生物在细胞分化过程中,一部分基因会被PcG蛋白沉默,以维持分化后细胞的属性(cell identity)。PcG蛋白形成PRC1和PRC2两个蛋白复合体,通过染色质修饰抑制靶基因的转录。其中PRC2的各组份在动植物中高度保守,其分子功能为催化H3K27me3。在动物体中,H3K27me3被PRC1复合体中的组分Pc识别并结合,进而通过另一组分Ph介导的染色质凝缩来抑制基因表达。植物没有Pc和Ph的同源蛋白,但H3K27me3这一修饰在基因组广泛分布,植物如何解密H3K27me3这一沉默标记尚不清楚。之前在模式种子植物拟南芥中发现LHP1蛋白能识别H3K27me3,然而lhp1缺失突变体表型弱,受影响的基因不多,从而提示植物中还存在其它的H3K27me3识别蛋白与植物特有的染色质凝缩蛋白EMF1协同抑制基因表达。因此,植物似乎演化出不同于动物的H3K27me3解密机制来调控基因表达。

何跃辉研究组通过蛋白互作分析找到了拟南芥EMF1蛋白的互做蛋白SHL和EBS。这两个同源蛋白含两个结构域:BAH和PHD。生化实验表明BAH结构域不仅介导与EMF1的互作,还能识别H3K27me3;进一步的分子遗传分析发现SHL和EBS与EMF1形成H3K27me3的 “reader-effector”复合体: SHL或EBS为reader,染色质凝缩蛋白EMF1为effector。这一复合体解密基因组上的H3K27me3沉默标记、抑制靶基因表达。在shl ebs lhp1缺失三突变体中,拟南芥基因组上的H3K27me3不能被维持,幼苗的体细胞分化被逆转,形成愈伤组织(图1);这一表型与H3K27 三甲基化酶缺失突变体高度一致。此外,研究人员发现在单子叶植物水稻中,SHL-EBS家族蛋白能识别H3K27me3并与EMF1的同源蛋白互作,形成类似的BAH-EMF1“reader-effector”复合体。这些发现揭示了植物在漫长的进化过程中演化出了与动物不同的H3K27me3解密机制来抑制基因表达,调控生长发育(图2)。

杜嘉木研究组和钟雪花研究组合作发现EBS蛋白为二价组蛋白标记阅读器:BAH和PHD结构域分别识别H3K27me3和H3K4me3标记。体外实验发现EBS结合H3K27me3的亲和力要高于结合H3K4me3的亲和力,进一步的结构生物学研究发现EBS的BAH结构域通过识别肽段H3K27me3的甲基化赖氨酸和第30位的脯氨酸来实现序列选择的特异性(图3)。有趣的是,EBS可以通过C端一段含有脯氨酸的无规则结构,以自抑制的方式抑制PHD结构域结合H3K4me3。植物体内的实验表明EBS在染色质上能结合H3K4me3和H3K27me3,其在拟南芥基因组上的分布与H3K27甲基化酶CLF的分布相似。EBS抑制成花素基因表达,从而抑制开花,进一步分析发现EBS作为一个分子开关,能分别识别H3K4me3和H3K27me3标记以及精确转变其结合偏好性来确保适时开花。

这两项研究揭示了植物巧妙解密靶基因染色质上的标记,以精准调控关键基因表达的新机制,对理解植物基因表达调控这一基本科学问题具有重要的理论意义,同时也为作物花期调控的生产应用提供了新思路。

相关链接:
www.nature.com/articles/s41588-018-0190-0#Sec35
www.nature.com/articles/s41588-018-0187-8


图1:shl ebs lhp1三突变体


图2:BAH-EMF1复合体介导的基因沉默模式


图3:EBS蛋白结构

;