人工智能又一新用途:IBM利用AI预测化学反应结果,可用于加速新药制作、
人工智能一直在为各行各业赋能,提供着新的研究工具。近日,IBM研究院的科学家从一种全新的视角来研究有机化学,并创造性的使用人工智能帮助他们预测有机化学反应的生成。
科学家们通过将化学反应中的原子视为字母、分子视为单词,随后利用人工智能语言翻译算法来实现有机化学反应生成物的预测。这一技术有望极大加速新药和新材料的研发。
相关论文在刚刚结束的NIPS 2017会议的深度学习分子和材料应用研讨会上发表。
在过去的50年里,人们都致力于教会计算机理解化学过程,以便于帮助化学家预测化学反应的生成。但由于有机化学十分复杂,而模拟这样的化学反应十分耗时结果也比较粗糙。人们一直以来都希望能有一个较好的方法来解决有机反应的模拟问题。
IBM的科学家们在深度学习应用的启发下,从不同的角度来思考了这一问题。他们利用自然语言处理中的人工智能翻译程序来对有机化学问题进性处理。“通常人工智能做的是将英语翻译成中文或者德语,但是在我们的研究中,我们让相同的程序来对化学原子分子进行处理。我们给程序提供了百万级别的化学反应数据,让它学习到有机化学的“语言”结构,随后尝试着预测出化学反应的可能生成物。”
论文作者IBM苏黎世研究员Teodoro Laino 说:“我们希望能通过这一工具为有机化合物设计新的合成路径。通常合成药物和其他复杂的有机物是十分困难的工作。这一工作能为有机化学研究带来飞速的进展,使得商业和学术上都将受益与研究时间的缩短和探索范围的增加。”
这一新的人工智能程序是一种神经网络,由很多神经元以一定的形式相互连接而成,在经过大量的数据训练不断调整这些连接的权重,以得到更好的结果。通过不断的学习,神经网络可以发现解决实际问题的最好模式,这也十分类似有机化学的研究探索过程。类似于小朋友学说话的过程,他们并不知道语法和规则但是一样会流利的表达,AI一开始对于有机化学一窍不通,但通过学习依然可以预测出化学反应的生成物。
实际过程中,AI可以从多种方式考虑,能根据概率提供多种解决方案,同时能够达到超过80%的准确率。目前AI能够处理的分子最大已经包含了150个原子,但理论上来说可以处理的分子大小没有上限,如果需要可以处理更长的分子。
论文合作者Théophile Gaudin表示未来希望将这一工作部署到云平台上,供全世界的工程、研究人员使用。同时还要继续提高算法精度达到90%以上。不同于现在使用较为通用的模型,他们计划对于不同类的有机物使用更加有针对性的模型来提高精度。
下一步的研究中还将把温度、溶剂和pH值等因素考虑进来期待进一步提高精度。由于AI并不完美,研究人员们创建这一工具的目的并不是替代有机化学家,而是为化学家们提供一个有力的助手。