我国科学家开发定量蛋白质组学数据解析软件pQuant

摘要 : 中科院计算所pFind研究团队与北京生科研究所董梦秋实验室合作,开发了定量蛋白质组学数据解析软件pQuant,用计算方法排除干扰信号的影响、提高肽段和蛋白质的定量准确度并对每个定量值进行准确性评价。相关文章发表于2014年6月3日的《Analytical Chemistry》杂志上。

中科院计算所pFind研究团队与北京生科研究所董梦秋实验室合作,开发了定量蛋白质组学数据解析软件pQuant,用计算方法排除干扰信号的影响、提高肽段和蛋白质的定量准确度并对每个定量值进行准确性评价。相关文章发表于2014年6月3日的《Analytical Chemistry》杂志上。

基于质谱的定量蛋白质组学是现代生物学技术的生长点之一,用于测量复杂生物体系中蛋白质及其翻译后修饰在不同条件下的丰度变化,是研究蛋白质功能和药物作用机制的重要工具。已有的定量软件往往不能有效排除干扰信号,定量值的计算方法有待完善,而且缺乏准确性评价,致使输出结果“鱼龙混杂”,引起的假阳和假阴两方面的困扰都比较严重。为了更好地解决这些问题,pquant开发者—计算所的刘超同学—研究了几百个可疑定量值的原始质谱图和色谱图数据,找原因、攒经验,充分挖掘肽段的质谱、色谱信号特点以及从肽段定量到蛋白质定量的方法,灵活应用各种组合和统计算法,建立了一整套非常细致的数据分析流程。

为了验证pQuant的性能,董梦秋实验室的宋春青同学通过轻重SILAC或14N/15N标记哺乳动物细胞或细菌,从10:1到1:10按不同比例混合得到14套标准样品,产生了14套测试数据集。测试结果表明,pQuant定量结果的准确性明显超过定量蛋白质组学领域的两个主流软件Census和MaxQuant,主要表现在:(1)pQuant输出的非数比值数目(即不能定量的部分)占总比值数目的0.01–0.5%,远低于Census的MaxQuant的对应比例2.5–10.7%和1.8–2.7%;(2)Census和MaxQuant输出了许多不准确结果,其定量值的标准差是pQuant的1.3–2倍;(3)pQuant给出了肽段和蛋白质定量比值的置信区间,而Census和MaxQuant没有准确性评价。

上述结果于2014年6月3日在美国化学会主办的《Analytical Chemistry》期刊上发表。

中科院计算所博士生刘超和我所博士生宋春青为本文共同第一作者。计算所的袁作飞、付岩、迟浩、王乐珩、樊盛博、张昆、曾文锋也参与了此项工作。贺思敏教授全程指导了pQuant算法的设计和评测。中科院计算所孙瑞祥博士和我所董梦秋博士为共同通讯作者。我们感谢王晓东实验室孙丽明博士和朱冰实验室徐墨博士提供的SILAC标记细胞,pFind团队邬龙、何昆和陈海丰,以及董梦秋实验室李铁梅和其他成员的帮助。该研究工作得到了科技部、基金委、中科院和北京市政府的资助。

原文链接:pQuant Improves Quantitation by Keeping out Interfering Signals and Evaluating the Accuracy of Calculated Ratios

作者:北京生科所

;