昆明植物所王学文博士完成新款基因组DNA微卫星序列软件的研发
SSR又称为微卫星序列,是一种由几个核酸为重复单位的DNA序列,广泛分布于动植物DNA种, 在种内和种间群的遗传中具有多样性,因此广泛应用于DNA的barcoding,SSR分子标记开发,分子育种,物种资源与个体鉴定。随着越来越多的基因组序列和转录组序列的产生,海量DNA序列的应用与开发成了一个关键的瓶颈。
中国科学院昆明植物所王学文博士与国家公安部物证中心共同自主研发了一款新的DNA序列中SSR分析和应用的软件,名字为GMATA (Genome-wide Microsatellite Analyzing Tool Package)。该软件具有五大功能:(1)SSR序列发掘,(2)统计分析,(3)统计图形,(4)分子标记设计与多态性分析,(5)SSR及分析标记在基因组中整合及图形化显示 。GMATA采用了全新的策略与算法,主要解决了大基因组数据中SSR分析与应用困难的问题,提供了一站式的DNA序列中SSR分析和SSR分子标记应用设计的解决方案 。
与已有的同类软件相比,GMATA是目前运行速度最快,功能最多的软件;首次提供5个层次的SSR统计分析与高分辨率的统计图形的生成;在Windows, 或者Mac OS,或者Linux平台运行,一台普通电脑就可以分析任何大小的DNA序列中SSR;具有多种友好可选运行界面,用户只需要点击鼠标或者输入命令;首次将SSR、SSR分子标记与全基因组序列、基因功能等数据图形化整合显示。GMATA是基因组大数据中SSR分析与分子标记开发的理想工具 。下载地址:http://sourceforge.net/projects/gmata/?source= navbar
研究人员使用本软件,对主要禾本科粮食作物例如小麦与水稻等15个全基因组序列和转录组序列进行分析,首次发现了禾本科中SSR分布的新规律。结果表明,以前对禾本科植物中的SSR的理解只适合小部分基因组;而绝大部分禾本科中的真正的规律为:最主要的SSR motif为二核苷酸单元的GA/TC,接着是A/T单元,然后再是GCG/CGC单元。禾本科含有丰富的G/C,但是最丰富的SSR却不是G/C。这些信息对分子标记的开发和应用选择具有重要指导意义。 此外,本研究还对五大类烟草的大基因组中的SSR分子标记进行开发 ,验证了本软件的应用前景。
本研究成果以“GMATA: an integrated software package for genome-scale SSR mining, marker development and viewing”为题,近日发表在植物科学主流期刊Frontiers in Plant Science, 文章链接为http://journal.frontiersin.org/article/10.3389/fpls.2016.01350/abstract .
软件使用界面
软件图形输出节选