Broad研究所发布新版基因组分析工具

2017年5月25日,美国麻省理工学院和哈佛大学博德研究所(TheBroad Institute of MIT and Harvard)公布了基因组分析工具包GATK的第四版。GATK4包含了新的工具和重建的结构。目前该软件的α预览版已在博德研究所主页发布,而进一步改进的β版将于6月中旬以开源产品的形式放在Bio-ITWorld网站供人们使用。

新版软件是由大幅精简的独立工具和ApacheSparkTM等增强性能的技术所构成。这个新结构提升了云部署的并行运算能力,使海量基因组数据的分析过程变得更加简化、快捷和有效。开发人员还希望它能在消除传统规模壁障的同时为用户提供期待中的高质量数据。

GATK4是由博德研究所和英特尔公司合作开发的,目标是利用高性能分析计算来处理来自全球的各种类型的大量基因组数据。在过去几个月中,软件工程师们和研究人员协同创建、优化和广泛分享了新工具和基础设施,来帮助科学家整合和处理基因组数据。通过此次合作,工程师们优化了基因组分析的软件和硬件,使其能有效合并和应用公、私混合云中的研究数据集。

目前,GATK在全球有45000名学术和产业用户,他们正在用它开展数以百万计的分析工作。GATK已成为辨识生殖细胞DNA和RNA序列数据中的单核苷酸多态性(SNPs)和插入缺失位点(indels)的工业标准。除了提升这些工具的性能以外,GATK4还将分析范围拓展至生殖细胞和体细胞研究中的拷贝数和结构的变化等应用。

(发布:)

;