新药研发的AI时代:人工智能带来的真正冲击是什么?
按:目前,药物开发中最热门的新领域之一是使用人工智能(AI)。许多人认为,药物研究和实验设计中的AI应用将十分有吸引力,从而更快地交付新的疗法。AI当然是一个引人注目的做法,尽管它仍然要证明自己。
药明康德最近与多名人工智能领域的专家进行了深度对话。在这篇文章中,我们将读到Numerate公司首席执行官Guido Lanza博士的看法。他认为AI可以产生最大影响的领域是真正的学习环路。在未来的三到五年内,AI会被应用到整个医药行业。这意味着没有经过各种AI驱动模型(包括预测的动物毒性,预测性人体毒性,预测性PK指数等)研究的候选药物将没法进入临床试验。
Numerate是一家开创性的AI公司,采用新型机器学习算法,致力于克服小分子药物发现的主要挑战。在心血管,神经退行性和癌症等疾病领域,采用传统的药物研发方法难以产生符合所有药物标准的先导化合物。因此,Numerate正在利用AI与传统的药物化学方法结合,预测候选药物成功与失败的因素。
▲Numerate的总裁兼首席执行官Guido Lanza博士曾担任Pharmix公司联合创始人兼首席技术官,2006年入选《Business Week》“30岁以下最佳青年科技创业家”。
药明康德:您如何描述AI领域的公司境况? 它们大多是初创企业,还是Google和Intel这样的大数据公司?
Guido Lanza博士: 这个领域的公司分布很平均,既有Numerate,Insilico Medicine,Berg Health和NuMedii这样的创业公司,也有GE和IBM这样的大公司。值得注意的是,各公司之间的开发能力重叠性相对较小。这个行业数据过剩,算法不足已经持续了很长时间, AI在可预见的将来会面临很多问题。
▲106家改变医疗行业的AI公司,红色方框内是从事新药开发的AI公司(图片来源:CB Insights)
药明康德:您的公司与其他利用AI进行药物研发的公司有什么不同? 你们怎么应用AI?
Guido Lanza博士: Numerate的第一个最明显的区别就是我们成立很久了。在没有人关注AI的时候,我们已经建立了一家AI技术驱动的公司。我们的初创团队里有计算机科学家和新药研发人员,他们在临床和市场上都有化合物。这迫使我们在很大程度上隐藏了人工智能的部分,并以更为传统的平台公司方式开展业务,围绕以服务和研发合作为重点的合作伙伴关系。这个商业模式使我们能够在10年的时间里投资了近5000万美元建立了我们的技术平台,其中大部分是非稀释性的资金。
从科学的角度来看,我们的差异化在于转化能力。首先,我们能够使用非常小的数据集来解决新兴的生物学问题,即使这些数据不适合用深入学习的方法进行研究。二,我们的建模是基于3D配体信息,不需要化合物结构信息。这些能力使我们的机器学习算法能够解决表型驱动的药物研发难题,这种研发通常是低通量,高内涵的生物学问题。
另一个转化能力就是我们的ADME和毒性预测功能。在这方面,我们投资了1000多万美元,其中包括与美国国防部防威胁减少局(DTRA)的大型合同,以建立和验证一套系统,可能将先导物快速转化为临床候选药物。今天,我们与制药公司的许多合作都基于这一能力,其独特之处在于能够从过去的所有研发项目中学习,为未来的每一个化学设计和候选药物选择提供决策。
药明康德:AI将如何改变药物研发和临床研究?
Guido Lanza博士: 十多年来,医药行业一直在努力通过各种计算方法来解决药物研发的成本和时间问题。显然,跟使用人力,以实验室为中心的传统药物研发方法相比,这也是AI的一个好处。然而,专注于计算方面会错过AI影响医药行业面临的最大挑战——增加基础生物学发现到患者应用的成果转化率。
在最早阶段,AI面临的关键挑战是从相对较小的数据集中提取大量信息。例如,我们的平台使我们能够非常快速地将学术研究的的实验(特点是数据很少,低通量,高内涵)转化为完整的先导物优化阶段的项目。我们与Gladstone研究所合作开展了这项工作,现在开始与加州大学洛杉矶分校(UCLA)和梅奥诊所(Mayo Clinic)进行了几个项目。
AI面临的第二个挑战是整合单个项目产生的大量数据(例如组学omics数据)。在这方面,像Berg Health这样的公司能够集成大量数据来推动程序具有更多的可预测性。还有组合应用NLP(神经语言程序设计),以利用整体的生物学知识来做决策,从而能够解释结果,发现不可见的关联——例如沃森机器人和Benevolent(译者注:一家领先的英国人工智能公司,关注健康和药物开发)。
▲IBM的沃森已在真实世界中带来的很大的影响(图片来源:IBM)
然而,AI可以产生最大影响的领域是真正的学习环路,这个概念首次引入业界。所有的决策都可以从以前所有成功和失败的经验推倒出来,这个首次提出的想法另令人印象深刻。我们一直在建立AI算法来预测化合物的PK和毒性特征,但现在,很多公司首次愿意分享他们的实验数据,以便我们能利用这些数据推出结论。在未来六个月内,我们将与一到两个大型制药公司合作,未来将会有更多的合作出现。
药明康德:AI最终会成为生物技术和制药研发的基准吗?如果是的话,还有多久实现?
Guido Lanza博士: 在未来的三到五年内,AI算法会被应用到整个行业。同时,根据AI提供的方法和价值,各方的接受程度会有所不同。
针对临床前应用,基于NLP的方法仍然需要重新调整定位,但用来解释结果将变得更常见。像我们公司用的、转化基于表型信号的新兴生物学的方法,会被许多生物科技公司用来启动项目或者变得更加普遍,从而使制药公司放弃今天传统的药物高通量筛选活动。同样,基于结构的,模拟驱动的AI将继续实现越来越多的目标。
▲大型制药公司都在探索人工智能(AI)改善药物发现工作的潜力(图片来源:pmlive)
更重要的是,在未来的三到五年中,药物研发将从孤立和匿名的成功转向借助人工智能利用综合知识的方式,无论是在公司内部研发或是在行业广泛应用。这样至少能避免一些(如果不是最多的)过去的研发错误。如果AI被证明比当前任何方法(PK,ADME,动物毒素,临床安全性等)更好,那么以完全传统的方式进行药物研发将变成一个明显的竞争劣势。这意味着在三到五年内,没有经过各种AI驱动模型(包括预测的动物毒性,预测性人体毒性,预测性PK指数等)研究的候选药物将没法进入临床试验。
药明康德:在制药和生物技术行业药物开发中使用AI的挑战或障碍是什么?
Guido Lanza博士: 当前的挑战主要在于文化。 首先,AI本质上意味着不可以解释,而是更多地用作“黑匣子”。我经常听到,为了使这些预测可信,科学家们想知道AI是如何做到的。我认为这是思考AI的错误方式。这些算法可以看到的数据中的信号对于人类而言太窄或太宽。因此,如果我们要求人工智能产生人为可解释的结果,就可能限制AI去解决最有趣的问题。
这方面一个很好的例子是从原始基因组序列预测人脸特征。Human Longevity公司表明,即使他们没有潜在的发育生物学模型,这也是可行的。要求预测结果“可理解”可能会限制技术去寻找鼻子形状或长度这样简单的遗传标记,而这几乎没有价值。
▲AI预测技术能够相当准确地“预测”基于基因组的个体面部特征(图片来源:Human Longevity)
另一个主要的文化挑战关于数据。制药公司需要进一步公开数据。这并不是说要分享他们目前正在开发的最热门靶标的最新数据,而是指共享可用于预测未来药物开发失败的几百万个数据点。作为一家专注于预测性ADME和毒性研究超过10年的公司,我们意识到这是一个很大的问题,但是像GSK与ATOM这样的公司正在引导和推动新的算法和方法的创建。
药明康德:什么样的合作关系对您公司的发展很重要?
Guido Lanza博士: 我们的客户合作关系分为三个方面。首先,我们与大型制药公司合作建立购买产品线形式的合作。在这方面,我们的合作伙伴,如武田(Takeda),会预先协商了由我们的AI平台产生的许可资产。此外,我们与大型制药公司更多是围绕数据而不是管线开展合作。在这些合作中,制药公司共享数据,通常是PK /ADME或安全性数据,我们提供AI平台,这种模式使双方都受益。最后一种类型是我们与学术机构的合作,我们希望延续有成功合作经验的合作伙伴,如Gladstone研究所、UCLA和Mayo诊所进行合作,以丰富我们自己的内部研发管线。这是获得最有希望的新兴生物学进步的一种方法,并使用我们的AI平台将项目转化为可合作的资产。
▲生物制药行业越来越重视与AI初创公司合作推动药物发现(图片来源:biopharmatrend)
另一种关键的合作伙伴关系是通过高素质的CRO联盟。我相信,在可预见的将来,人们不会(也不应该)接受AI的预测为真理。尤其是在这些方法得到改进之前,AI预测之后能够减少实验和验证,才会使我们(和其他AI公司)实现价值。显然,我们需要一个像药明康德这样一个在实验室化学/生物学领域的合作伙伴,另外还可能会与临床CRO形成合作关系。(实验)证据的责任仍然在AI公司,未来也将是这样。
药明康德:您公司的商业模式与传统的生物技术和制药行业的创业公司有何不同?
Guido Lanza博士: 传统的生物技术和制药创业公司一般侧重于少数靶标或单一治疗领域。我们更多地关注平台,以及如何更广泛地改变行业。我们的业务模式着重于捕捉产出的价值——我们可以产生的化合物资产。我们还围绕平台进行更多的关注数据/验证而较少关注收入的合作类型,但是我们的收入来自于建立后期可以获得转让收益的产品管线。我们一直在建立和扩展一系列管线,涵盖了众多治疗领域(CNS,心血管代谢,炎症),它们来源于我们内部研发,学术合作,购买或赏金猎人交易。
药明康德:运营一家AI初创公司,您有什么经验跟我们分享吗?
Guido Lanza博士: 作为一个刚刚创业的企业家,很容易认为解决技术障碍是最难的部分, 比如在我们这个领域如何生成算法和平台。我们很快就认识到,数据科学和商业问题同样不容易。首先,你必须真正了解你的算法正在应用的数据。我们花费了数十年的时间来解决计算化学方面称为“训练/测试悖论”的问题,就是在实验室应用前景很好的模型在实际中表现不佳,尽管它们的回顾性很好。为了解决这些问题,了解数据、解决生物学(及其带来的噪音)的混乱以及化学的挑战(以及它们带来的偏见)至关重要。
商业方面,关键在于确保产品从科学和商业的角度来看真正具有价值。毕竟,向已知药物中加入甲基可能会产生另一种活性化合物,但其价值几乎为零。为了做到这一点,至关重要的是要有一个新药研发团队,真正了解对我们最终客户——制药公司而言,什么东西才有价值。
药明康德:AI与以前的计算生物学热潮有什么不同?
Guido Lanza博士: 广泛来说,AI广泛影响了很多行业。计算机和数据存储终于足够便宜,以至于我们可以用正确的AI算法解决药物研发的问题。这使得大型企业(IBM/GE)能够开始影响医药行业,对目前封闭在制药公司内部数据库中的数据做点什么。数十年来,医药行业一直努力解决研发生产率低的问题。过去十多年来,人们开始建立虚拟药物发现初创公司。我们发展了Numerate的业务,专注于产品(化学和程序),却把AI放在幕后,也很少谈及我们的方法。如今,很高兴我们的方法有机会对大型和小型公司更加开放。事实上,这个领域的初创企业正在蓬勃发展,部分原因是公共的数据量不断增加,以及制药公司越来越愿意分享他们的数据。
另外,竞争环境也与10到15年前的计算生物学热潮不一样。我认为AI公司的创始人正在意识到,我们在大多数情况下并不是在相互竞争。首先,没有人拥有向制药销售打包软件/座位的模式。相反,我们专注于自己的产品管线或研发合作,这些合作不太可能直接相互竞争。 因此,真正意义上的社区正在形成,从分享联系,提供参考和合作组织会议,这在五年前是闻所未闻的。