欧洲银桦基因组登上Nature genetics

最近随着三代测序的火热,纯三代的基因组文章也遍地开花!技术的提升必然带来的基因组质量的提升,但是对做研究而言,最终还是得落到物种自身。下面这篇文章告诉你,没有熊猫血,怎么关注爆表。本文稿也将从项目专业角度来剖析欧洲银桦的NG之旅!

研究背景

森 林生态系统保有高份额的北半球生物多样性。北方森林大约占到全球森林的30%,且在各气候带中拥有最高的树木密度。此外,北方区域正在经历广泛的气候变 化,每年温度增长超过1.5 ℃,预计本世纪末全球温度将升高4-11 ℃,并伴随着增长量较少的降水。在这一阶段,气候带将以超过树木迁移的速度向北移 动,这对树木及其他生物的生存无疑会造成影响,所以揭示它们基因组古往今来的分子适应性特征至关重要。欧洲银桦广泛分布在欧亚大陆北方的森林,能够受诱导 一年内开花的北方树木。由于欧洲银桦具有快速的生活周期,较小的基因组,先进的种质资源,使之成为森林生物技术研究的模式物种。

研 究人员对150份银桦样品进行测序,将其中第四代自交系个体测序结果作为参考基因组进行组装,最终利用高密度遗传图谱进行染色体挂载,得到435 Mb。 分析80个来自不同地理位置的欧洲银桦个体及7个其它桦木科成员的SNP,通过这些位点进行群体遗传分析,对桦木家族的深入的进化分析和欧洲银桦受到的近 期中性选择起到了重要的意义。

研究结果

研 究人员将欧洲银桦自交系个体的基因组进行组装,并进一步组装到染色体水平。由于全基因组的六倍化事件获得的基因复制大大的丰富了转录调控,而串联复制则更 多的来自环境响应。80份个体重测序分析发现有效群体大爆发发生在气候巨变的关键节点。选择清除丰富于多倍化复制事件从而编码关键发育和生理相关功能,说 明环境适应影响植物基本生命代谢的时间周期和交互作用。光相应相关基因PHYC和FRS10紧密相关的变异与经纬度和温度相关,且PHYC还与降水相关。 细胞分裂素调控基因ARR1,树木发育基因KAK和MED5A也发现了类似的关联性。

研究内容

1. 基因组装及基因复制

欧 洲银桦基因组是通过Roche 454测得9×的混合核基因组,初级组装得到的Contigs,使用Illumina和SOLiD测序数据进行序列连接和 完善,最后用30×的长度大于6000 bp的PacBio reads进行最终的延伸和gap填补。第一次组装出 5,642 scaffolds,N50达到240 kb,经过PacBio完善后最终得到3,474 super scaffolds,N50长达 527.7 kb。通过使用超高密度基因连锁图谱,用340万markers组装得到14条染色体连锁群,包含391 Mb的scaffolds(小编评 论:组装效果不是很好啊!来一个纯三+HIC+光学,分分钟contigN50上Mb, Scaffold N50 上10 Mb)。该基因组预测得到28,153个基因,其中17,746能够得到全长转录组的支持。欧洲银桦基因组中转座因子占49.23%,反 转座子含量达到30.60%,其中Gypsy和Copia超家族含量有较大差异,而相比基因组大小相近的其他植物基因组,银桦含有更少的新转座元素,但是 非自主转座子TRIM含量却异常丰富,说明银桦中TRIMs可能具有抑制自主转座子的复制,从而限制银桦基因组的大小(小编评论:这一点在基因组研究中值 得关注,很多物种在进化的过程中都会出现大量的转座子插入事件,将对基因组的大小产生很大影响,进而产生更全面的影响)。共线性分析发现银桦并没有经历独 有的全基因组复制事件。

2. 群体结构特征

为 了更清楚的研究银桦的适应性,研究人员对五种二倍体桦木属植株 (Betula nana, Betula platyphylla, Betula populifolia, Betula occidentalis and Betula lenta)、 四倍体桦木(Betula pubescens)、两种桤木(Alnus incana and Alnus glutinosa) 和来自与爱尔兰、挪威、芬兰和俄罗斯的12个群体的银桦进行测序。另外,八个银桦观赏品种用于基因突变分析。PCA分析显示银桦与其他物种分群明显,流式 细胞仪分析结果也证实了银桦的特殊来源。共有显性等位基因分析显示银桦物种间存在基因流,除少数银桦个体外,群体结构高度混杂;二倍体物种 (B. occidentalis and B. populifolia)发现了其他物种明显的基因渐渗;基于SNP数据的系统发育分析显示 B. Lenta可能是B. pubescens的二倍体祖先,而B. Pendula是其异源四倍体的祖先。ADMIXTURE进一步分析银桦的群体结 构,结果显示群体能够划分成两群,区分度较弱,这可能是种间高度杂交的结果。观赏银桦特定基因突变分析发现LAZY1中编码区的提前终止使得观赏银桦品种 “Youngii”具有独特的下垂生长表型。

(小编评论:这一部分确定了本物种在整个桦木属的特殊性。从文章角度来看,研究的物种进化地位或者经济作用更重要,往往能有一个较好的结果。)

3. 群体历史分析古代瓶颈效应

除 观赏银桦外的60个桦木属个体,群体分析显示,连锁不平衡衰减缓慢,核苷酸多样性较低。桦木最早在前白垩纪时期(K-Pg)可能经历过一次大规模的灭绝, 在经历了随后的群体扩张之后,在始新世和渐新世、中中新世和更新世时期连续经受了环境变化带来了种群变化,这一结果与桦木科的化石证据一致。这能很好的解 释桦木科的物种形成历程,桤木-桦木物种形成于K-Pg事件(60 Mya)之后,中中新世时期事件(~14 Mya)可能是桦树亚种(white- barked birches)的物种形成时间节点。综上,以上参与分析物种为桦木科的物种形成史提供了依据。(小编评论:群体历史分析只能从大致趋势 上,看到物种历史进化过程中较大的历史事件,往往需要和历史环境事件想关联,这样才具有说服力。)

4. 选择性清除揭示定向的局部适应性

依 旧是上述分析的60个桦木个体重测序数据,对选择清除区域及2-kb侧翼区进行基因注释,去除细胞器及TE插入区附近的基因,最终获得913个基因与选择 清除相关。基因富集显示串联复制基因无显著的富集,说明串联复制基因可能参与不同的功能;对不同时期形成基因进行选择清除比较分析发现,近期选择性清除事 件可能会更多的影响到早期形成的调控元件。选择清除区域的基因明显富集到了跨膜受体蛋白酪氨酸激酶信号通路、肽组氨酸磷酸化和 longitudinal axis specification三类GO分类功能,这些基因与木质和纤维发育、光感受、胚胎发育和生殖隔离相关。(小编 评论:基因组文章中常见的不同群体间进行选择性清除分析,重点在于把选择基因与群体特性相关联。此篇文章中的候选区域筛选做得更为细致,分析更加复杂。单 纯从思路上来说,考虑的更加全面。)

5. 环境适应性相关基因

为 了排除群体结构对选择清除的干扰,研究人员进行了冗余度分析(RDA),全部913个受选择的基因中,423个基因所在区域受到了漂移现象的影响。去除该 影响后发现受选择基因的变异多样性与温度和降水等环境因素相关,例如:糖平衡的关键基因SWEETIE,核内复制抑制基因KAK,红光和红外光传感相关基 因PHYC和FRS10等。(小编评论:此部分分析有新意,值得推荐。此分析为进一步对候选基因的进一步筛选提供了新的思路。)

总结

该文章不沉溺于银桦的基因组基础分析,而是用大批量的群体材料分析桦木科的种群形成史,由面到点,层层深入,有理有据,虽未能揭示事件根源,但仍值得推荐。

;