基于高通量测序技术的杭白芷(Angelica dahurica)根转录组数据分析

为获得杭白芷转录组信息特征,本研究利用 Illumina HiSeqX Ten 测序平台对杭白芷根进行高通量转录组测序,获得高质量序列(Clean reads) 47 742 445 条,Trinity denovo 组装后得到 47 044 条 Unigenes,平均长度 1 164.20 nt。BLAST 分析显示分别有 32 208 (68.46%)、23 049 (48.99%)、10 479 (22.27%)、17 883(38.01%)、28 201 (59.95%)、20 731 (44.07%)、55 (0.12%)条 Unigenes 在数据库 NR、Swiss-Prot、KEGG、KOG、eggNOG、GO、Pfam 中获得注释,可归为 GO 分类的生物过程、细胞组分和分子功能 3 大类 57 分支,涉及 205个 KEGG 代谢通路,其中包括 27 个次生代谢通路。蛋白编码框序列 32 303 个,高等植物转录因子 58 个家族,借助 MISA 软件发现 10 020 个 SSR,其中二碱基重复最丰富,有 4 336 个,出现频率为 43.27%;五碱基重复 SSR 最少仅占 0.37%。本研究获得了大量基因序列信息以及 SSR 信息,为今后开展相关分子机制研究提供了数据资源和理论基础。

;