上海有机所发表大规模代谢物结构鉴定新算法MetDNA
近日,国际学术期刊《自然-通讯》(Nature Communications)杂志发表了由中国科学院上海有机化学研究所生物与化学交叉研究中心研究员朱正江课题组的最新研究成果“Metabolic Reaction Network-based Recursive Metabolite Annotation for Untargeted Metabolomics”。基于液相色谱-质谱联用(LC-MS)技术的非靶向代谢组学研究严重受限于代谢物结构鉴定的低效率和低准确度。该工作首次发展了一种基于代谢反应网络的代谢物结构鉴定算法MetDNA,创新性地克服了代谢物结构鉴定对于代谢物标准MS/MS谱图库的依赖,能够在多种生物样本中鉴定出超过2000种代谢物的结构,相比传统方法提高了近10倍,极大地提高了代谢物结构鉴定的效率和准确度。
代谢组学技术主要分析生命体内小分子代谢物的含量和动态变化规律,帮助更直接、更准确地研究疾病发生的机理,实现对疾病的早期预防、诊断和治疗。液相色谱-质谱联用(LC-MS)技术能够同时检测多种代谢物,具有高选择性和高灵敏度等特点,是代谢组学研究的主要工具之一。基于LC-MS技术的非靶向代谢组学研究虽然能够在一次检测中采集数万个代谢物信号特征峰,但是严重受限于代谢物结构鉴定的低效率和低准确度。小分子代谢物的标准MS/MS谱图库是代谢物结构鉴定的关键,目前必须通过采集代谢物标准品获取。但是目前大量代谢物没有标准品,因此代谢物标准MS/MS谱图数目的缺乏严重限制了代谢物的结构鉴定和代谢组学的应用。针对代谢物结构鉴定的挑战,朱正江开发了一种基于代谢反应网络的代谢物结构鉴定新方法MetDNA(Metabolite identification and Dysregulated Network Analysis)。
在细胞代谢中,一个代谢物可以通过酶催化反应转变为另一种代谢物。同一个代谢反应中两个代谢物可定义为反应对邻近代谢物(reaction-paired neighbor metabolite)。反应对邻近代谢物具有结构相似性,因此其MS/MS谱图也具有一定的相似性。利用这个原理,MetDNA算法利用样本中已经鉴定出的代谢物作为种子,进一步鉴定代谢网络中邻近的代谢物。新鉴定出的代谢物可作为新的种子,继续鉴定代谢网络中邻近代谢物,递归运算,直到不再能够鉴定出新的邻近代谢物。该算法的最大特点是可以通过代谢反应网络去鉴定没有标准MS/MS谱图的代谢物,使得代谢物的结构鉴定并不依赖很大规模的标准MS/MS数据库。例如,MetDNA方法可以利用20个种子代谢物即可完成>1000个邻近代谢物的注释,创新性地克服了代谢物标准MS/MS谱图库数目的限制。研究人员使用MetDNA处理了多个数据集(涵盖5种物种、7种样品类型以及多种仪器平台),所有的数据集都能鉴定出来约2000个代谢物的结构,证明了MetDNA是一个不依赖于平台且较为通用的代谢物结构鉴定算法和工具。
为了方便研究人员使用MetDNA,朱正江课题组开发了基于阿里巴巴云服务器的MetDNA网络软件平台(http://metdna.zhulab.cn/),学术界用户可以免费进行注册使用,商业用途需要联系朱正江进行授权使用。MetDNA算法已经申请了国家发明专利和软件著作权的保护。
上述工作由朱正江为通讯作者,研究生申小涛为第一作者。上海有机所生物与化学交叉研究中心研究员刘南及研究生马在军参与了该研究。经费支持主要来自国家自然科学基金委和中科院。
大规模代谢物结构鉴定新算法MetDNA