中国科学家主导完成另一二倍体棉花——木本棉全基因组图谱——最新研究成果于《自然•遗传学》发表

继2012年完成雷蒙德氏棉基因组测序后,中国农业科学院棉花研究所、深圳华大基因研究院、北京大学生命科学院等单位又联合完成另一二倍体棉属植物——木本棉(Gossypium arboreum)基因组。该研究成果于2014年5月18日发表在《自然•遗传学》(Nature Genetics)杂志上。科研人员在本研究中成功绘制出高质量的木本棉基因组图谱,结合雷蒙德氏棉基因组进行了比较分析,并对棉属进化机制及重要经济性状功能基因进行了初步分析。这些研究结果将极大的推动对四倍体棉种及其它多倍体物种的形成过程的揭示,为进一步研究棉花纤维质量和抗病虫灾害等重要农艺性状奠定了重要的遗传学基础。

棉花是全球最重要的经济作物之一,棉花属共包括46个二倍体棉种和5个已经确认的四倍体棉种,所有的二倍体棉花物种均可能由一个共同的祖先进化而来,这个祖先随后多样化分化成八个组,包括A、B、C、D、E、F、G和K。而所有的四倍体棉花物种都是由A-基因组物种木本棉(G.arboreum(A2))和D基因组物种雷蒙德氏棉(G.raimondii(D5))物种间杂交形成。由于棉花属基因组的复杂性,对其进行遗传分析、基因组及功能分析等工作非常困难,阻碍了棉花育种改良的发展。

在本研究中,科研人员对一株连续培育18代的纯系栽培木本棉shixiya1(SXY1)进行了全基因组测序,绘制出的高质量木本棉基因组大小约为1,694 Mb,共有41,330个编码基因。利用高分辨率的遗传图谱, 将90.4%的木本棉(G.arboreum)组装序列成功定位到13个连锁群上。研究人员对该基因组进行了注释,结果显示木本棉基因组中68.5%是由不同类型的重复序列组成,其中95.12%为长末端重复序列(LTR)。

木本棉的基因组大小约为雷蒙德氏棉的基因组(775.2Mb)的两倍,通过比较基因组学分析,研究人员发现造成两个基因组大小差异悬殊的主要原因是LTR插入和LTR基因家族的扩增。在这些大量扩增的序列中,LTR逆转录因子数量发生了显著的增长,在雷蒙德氏棉中它们的总长为348M,而在木本棉中这个数据显著增长到1,145M。研究人员认为此分子机制解释栽培木本棉物种中发生LTR数量急剧增长现象的论断。

黄萎病是一种广泛存在的,极具破坏性的棉花疾病,它是由土壤传播真菌病原体Verticillium dahliae引起的。雷蒙德氏棉对于这个病毒具备很强的免疫力,然而木本棉和可可树却很容易受到侵害。研究人员将木本棉基因组和雷蒙德氏棉以及可可树基因组相比较,在与抵抗疾病相关的基因区域中发现,NBS 编码基因表达形式在这三个物种间发生了明显的差别。科研人员对抗黄萎病的分子机制研究对于分子育种和遗传改良重要农艺性状相关基因提供了非常重要的遗传信息。

棉花纤维是纺织行业的重要的天然原料,棉花A-基因组物种能够产生可用于纺织的纤维,然而D-基因组物种不能产生出这样的纤维。有研究发现乙烯是能够促进棉花纤维伸长的一个非常重要的调控分子,在棉花纤维生成过程中,ACO基因调控的产物参与乙烯生物合成的最后关键一步。研究人员发现,在雷蒙德氏棉幼籽中存在非常高的ACO转录本水平,并且能够促进形成早期纤维衰老表型,在木本棉幼籽中ACO基因转录的失活可能是这类棉属物种具有短纤维表型的原因,而在陆地棉这样的棉属物种中ACO表达纤维特定的上调能够促进纤维的生长。在本研究中,通过不同棉属物种ACO转录本的定量研究,科研人员发现,正如木本棉和雷蒙德氏棉表现的那样,ACO基因的失活和过量产生都会抑制棉花纤维的生成,为纤维细胞形成机制提供了重要的数据,有助于在后续育种中培育产出更高质量棉花纤维的品种。

;