生化与细胞所科研人员通过预处理显著提高定量蛋白质组数据的鉴定效率

11月30日,国际学术期刊《分子与细胞蛋白质组学》Molecular & Cellular Proteomics在线发表了中国科学院上海生命科学研究院生物化学与细胞生物学研究所系统生物学重点实验室曾嵘研究组与美国范德堡大学定量科学中心石瑜研究组的最新合作研究成果,揭示了稳定同位素化学标记高精度质谱数据中高丰度、高频率噪音离子的去除可以显著提高蛋白质鉴定率。

在定量蛋白质组学研究中,稳定同位素标签结合高精度质谱仪可以在一次实验中对多个样品进行相对定量比较,这种策略比非标记定量具有更高的精确性。另一方面,体外化学标记相对于体内标记方法如SILAC,具有更高的样品通量和普适性,使得体外化学标记在定量蛋白质组学研究中得到了广泛的应用。对于该策略得到的肽段二级质谱谱图,其中的报告离子用于定量,而其他离子则用于鉴定该肽段。但报告离子以及其伴生离子并未包含多肽序列信息,这些离子会降低数据库搜索鉴定的敏感性和准确性。由于定量是建立在数据库鉴定的基础之上,在数据库搜索前对质谱数据的预处理就尤为重要。

在曾嵘研究员和石瑜教授的共同指导下,盛泉虎、李荣霞和戴捷等人对稳定同位素化学标记数据首先进行了高丰度、高频率离子的分析,然后进行了16种不同组合的数据预处理,最后用5种不同搜索引擎进行了数据库搜索分析。研究表明,在高精度质谱数据中,存在大量稳定同位素标签相关的高丰度、高精度离子。结合各种预处理方法,判别和去除这些离子可以提高四标数据16.3%的鉴定谱图,13.9%的鉴定肽段以及6.6%的双肽段鉴定蛋白质。对于八标复杂数据,预处理方法则可提高50.2%的鉴定谱图,39.5%的鉴定肽段以及25.2%的双肽段鉴定蛋白质。这表明,标记通道的增加,在提高样品通量的同时,也引入了更多的伴生离子,判别和去除这些离子可以更显著提高鉴定的敏感性。

基于组学大数据和系统生物学平台,曾嵘研究组通过多年努力自主开发了一系列蛋白质组数据分析技术,该工作建立的方法与此前的Buildsummary,ProteomicsTools, SRMBuilder 等工具一起 (Sheng et al., J Proteome Res 2012; Su et al., JMCB, 2014),形成了更加完善的蛋白质组学工作流程。

该研究工作得到了国家科技部和国家自然科学基金资助。(生化与细胞所)

示意图:预处理可以显著提高谱图、肽段和可靠蛋白质的鉴定率

;