美国家实验室借助超算识别生物燃料的主要障碍

由木本植物和废弃生物质生产的纤维素乙醇是成本低廉可再生运输燃料的理想候选品,但作为细胞壁主要组成成分的木质素是发展纤维素乙醇最大的障碍。为了更好地理解木质素的存在形式,美国能源部橡树岭国家实验室研究人员(ORNL)实行了一次迄今为止最大规模的生物分子模拟实验,模拟2370万个原子组成的系统,该系统代表在酶环境中进行预处理的生物质(纤维素和木质素)。这一庞大的模拟实验需要借助旗舰超级计算机泰坦的帮助,以跟踪和分析数以百万计的原子间的相互作用。

这项研究从原子论角度揭示:木质素不仅本身与纤维素结合,且结合位点是纤维素与酶的优先结合位点,木质素吸引发酵酶并占据其结构上纤维素的结合域。除了帮助洞察发展下一代生物燃料的挑战,模拟实验也有助于指明减少木质素影响的可能路径。此外,在领袖级超算的帮助下,此番对生物质系统的模拟实验也促进计算生物物理学向复杂、多组分的体系转变。

在预处理期间,通过酸、水和热等作用于植物材料以去除非纤维素生物质。但木质素在纤维素周围聚集,阻碍酶与纤维素接近。为了准确地模拟这种环境,研究小组利用实验数据来创建经预处理的生物质和酶的代表性样本。该模型考虑了诸如纤维素与木质素的比率,木质素的类型和酶的相对量等因素。模拟实验共跟踪9个纤维素纤维,468个木质素分子和54个酶分子。

该小组利用称为GROMACS的分子动力学代码建立了完整的模型。随后,研究小组利用泰坦观察生物系统动态。其最大的运行实验占用泰坦18666个节点中的4000个。此外,研究小组调整GROMACS,以简化泰坦数以千计的CPU内核之间的通信。还通过增加计算效率来跟踪原子间长距离的相互作用,将时间步长从2飞秒增至4飞秒或四千万亿分之一秒而不失精度。

所得数据被转移到OLCF的高性能存储系统。通常情况下,以串行分析为主,但计算能力的提升和模拟规模的扩大使得耗时过长成为分析过程的主要瓶颈。为了解决这个制约因素,研究小组使泰坦成千上万的处理器可以通过协同工作来执行并行分析,极大地提高分析速率。

(发布:)

;