Nature Methods发表最大规模人类蛋白质互作数据库,可帮助解读基因组数据
麻省总医院(MGH)和Broad研究所的人员领导的一个国际团队开发了最大规模的蛋白质-蛋白质互作网络数据库,称为InWeb_InBioMap(InWeb_IM),这个资源可以阐明多种疾病相关基因是如何引起疾病发生和发展的。相关文章目前已经在《Nature Methods》杂志上在线发表。
文章共同通讯作者、该项目的负责人、MGH外科和Broad研究所斯坦利精神病研究中心的Kasper Lage博士表示,“现代遗传技术让我们可以对癌症或精神疾病患者的基因组进行测序,但是要理解致病基因变异是如何影响细胞系统的仍然非常困难。拥有更完整的人类蛋白质物理互作图谱,能帮助我们以一种更高的分辨率,研究受疾病影响的细胞过程。”
InWeb_IM蛋白数据库可用于基因组数据的分析
虽然绘制大型蛋白质-蛋白质互作网络图谱的重要性已经被广泛认可,但之前只鉴定出了不到30,000个直接互作,仅占最保守估计互作总数的四分之一。
Lage的团队和来自丹麦和英国的研究人员合作,开发了一个计算框架,整合来自43,000多篇已发表文章的数据,包括来自8个已有蛋白质-蛋白质互作数据库的数据。他们在创建InWeb_IM时采用了严格的质控标准,截止2015年2月文章提交时,InWeb_IM中已经含有约586,000个互作,目前包含的互作数量已经超过625,500。
文章共同作者Taibo Li解释道,“人体内蛋白质都是成群发挥作用的,它们通过在蛋白质网络中物理互作完成功能。可将蛋白质互作网络与人类社交网络如Facebook进行类比:Facebook平台基于网络中人与他人的互动模式,推测出相互认识的人或者拥有共同爱好的人;构建蛋白质互作网络同样可以推测出基因群和分子通路,进而提升我们对人类细胞中生物过程的理解。”
Lage补充道,“基因组测序费用的下降速度,远远超过了我们解读在未确诊疾病患者中检测到的基因变异的能力。通过分析可能引起疾病的基因和蛋白质互作网络,临床医生可以找到难以辨别的遗传数据模式,我们在文章中针对癌症和自闭症进行了说明。例如,约30个基因与心肌病相关,但是很多心肌病患者却没有这些基因的突变。通过观察这30个心肌病基因在蛋白质水平上的互作模式,我们可以依据‘心肌病网络’鉴定新的候选基因,这些基因可能是引起疾病的新的分子机制。我们希望InWeb_IM可以作为一种资源,帮助解读临床外显子组测序数据,并在未知疾病患者的诊断中发挥作用。”
该团队正在继续开发使用InWeb_IM解释大规模基因组数据集的方法;通过整合蛋白质组、转录组和基因组数据,以组织特异性的方式加强对复杂生物系统的理解。另外他们还与几个MGH的研究小组合作,利用这些信息去了解心血管疾病、出生缺陷、癌症、生殖疾病和精神疾病。
参考文献:
Taibo Li,Rasmus Wernersson,,Thomas S Jensen& Kasper Lage.Ascored human protein–protein interaction network to catalyze genomic interpretation, Nature Methods (2016). DOI: 10.1038/nmeth.4083
本文来源于:测序中国
欢迎关注中科紫鑫人事招聘相关信息:http://www.ngscn.com/index.php/Job/employ