基于 Illumina HiSeq 2000 测序技术对大花序桉根的转录组特性分析

大花序桉(Eucalyptus cloeziana)是中国重要用材林树种,但目前对其生物信息学研究缓慢,在一定程度上限制了大花序桉分子育种以及品种改良。采用 Illumina HiSeqTM 2000 高通量测序平台对 1 年生大花序桉根系转录组测序和 de novo 组装,将得到的 Unigene 与公共数据库比对,同时进行转录组分析。结果显示,组装获得 53 433 条 Unigene,其平均长度 890 bp,N50 长度为 1 587 bp;有 34 700 条 Unigene 获得注释信息,占全部 Unigene 的 64.94%,其中 19 327 条 Unigene 注释到 KOG 数据库,被分到 25 个类别中,共得到32 302 个 KOG 功能注释信息;有 11 197 条 Unigene 注释到 GO 数据库中,共获得了 54 971 个 GO 注释功能,归于细胞组分、分子功能和生物学过程三大类;有 12 181 条 Unigene 得到 KEGG 注释,其中 6 493 条Unigene 归入 128 条代谢途径,发现有 57 条 Unigene 参与氮代谢途径。通过软件查找获得 13 290 个 SSR 位点,二核苷酸重复类型占的频率最高,其次是三核苷酸、四核苷酸和六核苷酸,五核苷酸重复频率最低。本研究首次对大花序桉转录组进行分析,为深入开展大花序桉分子生物学研究提供基础数据来源。

;