又双叒叕《Nature》封面——最强大麦基因组,华大助力!

大麦是温带地区重要的禾谷类农作物。大麦基因组全长5.1 Gb,约为水稻基因组的11倍,含有3.9万多个蛋白编码基因,且多数为多拷贝,形成了复杂的基因家族,且富含转座因子,因此全基因组测序工作难度巨大。本次研究中,研究人员综合利用4.5T的BAC测序、57X的BioNano光学图谱、50X的染色体构象捕获(Hi-C)等多种技术手段结合,组装出了迄今最为完整的大麦基因组物理图谱。94.8%的组装序列被定位到各条染色体上,完善的基因组组装结果为大麦的种质资源利用和遗传改良提供了良好的基础。

物种名称:大麦

拉 丁 名:Hordeum vulgare L.

发表时间:2017年4月

发表期刊:Nature

影响因子:38.138

发表单位:浙江大学、德国莱布尼茨植物遗传学与农作物研究所、英国詹姆斯·赫顿研究所、澳大利亚默多克大学、德国环境卫生研究中心、丹麦嘉士伯研究实验室、华大基因等

华大基因助力合作伙伴,再次拿下每年1/52机会的《Nature》封面!让我们一起来看看此次大麦是如何吸睛的。

测序策略

对87,075个 BAC进行二代测序获得4.5T数据,BAC to BAC组装 + Hi-C 50X + BioNano 57X;

组装结果

组装基因组大小是4.79Gb, Contig N50=79Kb,Scaffold N50=1.9 Mb;

重要分析结果

1 Hi-C辅助大麦基因组组装至染色体水平

研究人员利用BAC to BAC +BioNano+遗传图谱+Hi-C等多种技术手段联合组装构建迄今最为完整的大麦基因组参考序列,组装大小约为4.79Gb,构建了6347个超级scaffold。(见表1)

表1 大麦基因组组装结果

2 染色体构象捕获分析

据报道,在人、拟南芥、果蝇、酵母等物种中,Hi-C的互作频率与碱基序列的线性距离呈负相关。但是在大麦中,染色体互作频率在200Mb 的位置有显著的上升(图1a),且在染色体内Hi-C作用矩阵中呈现出显著的反对角模式,说明该染色体首尾两端区域互作频率增大(图1b);研究人员猜测这种互作模式反应的就是所谓的Rabl结构:每条染色体向后折叠使长臂和短臂并列,所有着丝粒和端粒分别聚集在细胞核两极(图1c),荧光原位杂交试验结果也支持这一假设(图1d),大麦1号染色体和2号染色体间的Hi-C互作同样呈现反对角模式(图1e)。

图1 染色体构象捕获分析


3基因组重复序列分析

研究人员按照互作频率等特征将大麦1号染色体划分成3个区域,发现大麦转座子的插入位点呈现多样性。如反向重复转座子和长散在重复序列主要出现在基因富集的末端区域(即zone1)。相反,逆转座子 Gypsy 则主要分布在中心区域(zone3),而丰产因子Copia 转座子则主要分布在zone1和zone2。不同转座元件在基因区域的上下游的分布情况也有不同(见图2)。

图2 大麦基因组重复序列分析

4基因家族分析

将大麦和高粱、水稻、二穗短柄草、拟南芥进行GO分析发现差异最显著的结果为防御应答、抗病以及硫氧还蛋白等基因。发芽中的大麦拥有很高的淀粉糖化能力,主要的糖化酶有α 淀粉酶。本次测序的大麦栽培种Morex 的α 淀粉酶基因家族(amy)含有12种基因序列,可以分成4种基因亚族。位于6号染色体和7号染色体上的基因亚族amy1和amy2 都发生过基因复制事件(图3b)。

图3 大麦基因家族的扩张

看到这里是不是对BioNano光学图谱技术和Hi-C技术感兴趣了呀?快联系我们的各地销售吧。

;