Nature综述系列:人类药物基因组还有38%完全未开发!
许多生物医学研究和治疗的开发集中在人类基因组的一小部分,忽略了许多疾病相关的蛋白质和相关的科学和商业机会。美国国家卫生研究院(NIH)开启的药物基因组计划(Druggable Genome programme)旨在促进充分地研究目标。作为这方面努力的一部分,影响因子47.12的Nature Reviews Drug Discovery在2017年的1月刊登出了一期海报,这个海报提出了在人类基因组的基础上可开发药物数据的蛋白质分类,包括从各种来源的信息和知识。基于5年期间的全球药物销售数据,说明了治疗目标的商业聚焦点和相关疾病领域。
1 该统计将蛋白分为四类
该海报用三个准则将蛋白质分为四类:已作为药物靶标的蛋白归类为Tclin ;已经知道是作为小分子调节剂的分类为Tchem;被确认为OMIM疾病表型相关或被Gene Ontology (GO)实验现象注释过的蛋白分类为Tbio;剩余的蛋白被归类为Tdark。从图上我们可以看出38%的蛋白属于Tdark,这些蛋白对它们很少了解并且只有最低数量的分子探针可以用。从NIH R01的资助来看这些蛋白的研究几乎没有接受到什么经费。通过对全球药物销售的商业活动分析看出,全球药物主要的销售只涉及3%的Tclin。目前人们能够运用小分子特定和选择性的干扰的蛋白只占人类蛋白组的10%。
2 对Tdark蛋白了解匮乏
在下图中不同的资源和数据集用于检验Tdark和其它蛋白比(四种蛋白颜色分类同上图,Tdark仍然是黑色的),在注释方面的匮乏。对Tdark蛋白知识的匮乏性提示了如果有资源进一步调查这类蛋白,还有相当的机会有新发现,最终有新的商业机会。
3 全球药品销售数据的目标中心分析
在评估当前关于潜在药物目标的知识水平时,从治疗的角度该海报提出了一个问题:“什么是最有利可图的目标?”为了探讨这一问题,作者们分析了在5年内累计(2011 - 2015)的、来自75个国家的药品销售IMS Health的数据,包括日本的和那些在欧洲和北美洲的。其中不含植物的、传统中国和顺势疗法的药物和干扰非人类目标的药物(如一些抗病毒药物)。一共鉴定了51095个独特的产品,这些被归类为1069个活性药物成分并通过靶向Tclin的数据修正。结果通过一共圆形的直方图描述,销售的价值表现在同心圆周围的直方图里。
本海报中讨论的七个目标类的商业影响总结在以下的表格中。最赚钱的目标是G蛋白偶联受体(GPCRs)。
前20 Tclin蛋白靶点的销售数据排名,也在下表中列出。
该海报的分析确定了知识赤字,而不仅仅是有关实验数据,而且在专利和出版物方面。分析人员相信这一点会给予新药研发的新研究和商业机会。
本文来源于:生物探索
欢迎关注中科紫鑫人事招聘相关信息:http://www.ngscn.com/index.php/Job/employ