国家基因库研究团队发表RNA编辑检测软件RES-Scanner

2016年8月18日,国家基因库生物多样性基因组研究团队在《GigaScience》杂志上发表了一款名为RES-Scanner的RNA编辑位点检测软件,该软件能利用DNA和RNA测序数据,高效地实现任意物种全基因组范围的RNA编辑位点的检测和注释,有望促进对更多非模式物种的RNA编辑模式进行研究,加深人们对RNA编辑调控的认识。

遗传学的中心法则认为,遗传信息需要准确地从DNA传递到RNA,从而指导蛋白的合成。然而,这一法则近年来却受到一种名为RNA编辑的转录后调控机制的挑战。RNA编辑能通过在基因的转录产物上增加、删除或替换一些碱基,从而产生基因组模版无法编码的转录本。该机制广泛存在于植物、真菌、原生动物以及后生动物中。作为一种转录后调控机制,RNA编辑可以改变氨基酸编码、影响RNA的剪切以及RNA的稳定性等。不少研究表明,RNA编辑对动物神经系统的功能具有重要的调控作用,异常的RNA编辑往往与神经性疾病、精神障碍甚至癌症相关联。

近年来高通量测序技术的广泛运用,为RNA编辑研究领域带来了革命性的进展。但目前在全基因组范围准确检测RNA编辑位点方面仍面临着多项技术难点,主要包括由遗传多态性(主要是SNP)、测序错误以及序列比对错误等造成的假阳性。此前已有两个RNA编辑位点检测软件公布,即REDItools和GIREMI,但它们要么对排除假阳性方面缺乏合理的统计检验;要么只针对人的数据进行研发,缺乏对非模式物种的特有因素进行考虑,例如,样品可能不是二倍体,该物种可能缺乏全面的遗传多态性数据等。

为此,国家基因库研究人员自主研发了一款灵活高效的RNA编辑位点检测软件,并将此命名为RES-Scanner (RES代表RNA editing site)。该软件能实现自动化的RNA/DNA序列比对和过滤,DNA纯合基因型的判定,以及候选RNA编辑位点的检测和注释。为了去除遗传变异(SNP)导致的假阳性,RES-Scanner通过严格的统计模型来确保候选的RNA编辑位点在DNA水平的基因型是纯合的,并且该模型不仅可以运用于来自单个个体的样品,对于多个个体混合的样品以及多倍体的样品也同样适用。此外,RES-Scanner通过统计模型把真正的RNA编辑位点和测序错误区分开来,而且还执行了多重严格的过滤来排除由于比对错误等其它因素造成的假阳性。

通过与其他现有的RNA编辑检测软件(REDItools和GIREMI)进行系统的比较,研究人员发现RES-Scanner不仅在处理人的数据中具有与其他软件相当的高准确性,在非模式物种中,特别是在具有多个样本的情况下,甚至更胜一筹。例如,在处理分别由许多个体混合产生的9个蚂蚁样品的数据时,RES-Scanner能很好的排除每个混合样品中的低频SNP,并通过联合9个样品的数据,进一步提高了检测的完整性和准确性,最终评估的错误发现率仅为4%,在三个软件中表现最佳。值得一提的是,RES-Scanner相对于同样基于DNA和RNA数据检测编辑位点的软件REDItools,计算速度提高了2倍,大大地节约了计算资源。

“转录后的RNA编辑使有机体能在RNA层面摆脱遗传物质DNA的束缚,对物种的环境适应性以及进化都具有重要意义。然而,该领域还有很多问题有待回答。”该项目负责人李启业表示,“RES-Scanner为用户提供了一个从原始测序数据比对到最终RNA编辑位点判定的一体化工具包,我们期望它在不久的将来能为拓展人们对RNA编辑调控的认识作贡献。”

文章链接:https://gigascience.biomedcentral.com/articles/10.1186/s13742-016-0143-4

软件链接:https://github.com/ZhangLabSZ/RES-Scanne



;