解读美材料基因组计划:数据共享乃大势所趋
MGI于2011年6月启动,旨在将应用于能源、交通和安全等领域的先进材料的开发时间和资金成本减半。
图片来源:AMANDA BARNARD
美国的材料基因组计划(MGI)启动至今已有两年,5位专家日前在《自然》杂志撰文,指出材料科学家应该如何在该计划中实施工作。
Sally Tinkle: 借鉴其他项目
华盛顿科技政策研究所政策分析师
MGI由总统巴拉克·奥巴马于2011年6月启动,旨在将应用于能源、交通和安全等领域的先进材料的开发时间和资金成本减半。两年过去了,数亿美元已经投入到了学术、产业和联邦机构的项目中。
数据共享与计算工具开发对MGI的成功至关重要。先进材料复杂的物理与化学特性可以因不同的应用需要而相应调整,并可以在合成、生产和使用过程中改变。对这些特性的跟踪是一项非常艰巨的任务,MGI的努力还包括将术语、数据归档格式和指南报告标准化。
幸运的是,MGI可以从现有的纳米技术协作项目中得到借鉴。美国国家纳米技术项目(NNI)在10年前建立,它针对1~100纳米范围内的材料,是MGI的合作项目,MGI的材料范围是纳米到微米级。
MGI可能会考虑加入NNI的纳米技术知识基础设施计划,该计划于2012年5月启动,旨在开发一个数字数据和信息框架,并加强科学和建模团体之间的协作。该计划已仿照美国宇航局的技术准备标准,定义了一组数据准备标准,力图提供传达材料数据的质量与成熟度的基础。
MGI还可以加入NNI和欧洲委员会的合作关系,以支持关于数据共享具体细节的大西洋两岸对话。
数据共享是一种固有的协作活动,有着更快速推进材料科学发展的潜力。MGI可以使现有的项目更具活力,并成为共享所有尺度的材料信息的平台。
David L. McDowell:激励分享
亚特兰大佐治亚理工学院材料研究所执行董事
MGI必须避免这样的态度,即“项目建成,所有目标就会实现”。对于合作和分享其数据与技术的科学家和工程师来说,激励措施非常必要。MGI必须要有一些东西,可以使每一个人受益。
数据共享的环境必须吸引和促进合作。利益相关者在检索现有数据之外还有着广泛的利益——他们想要发现新材料,并期待得到改善的产品。直观健康的网络环境,以及分散和有机的网络基础设施发展要比集中式的网络环境更能激励不同用户作出贡献。
社交网络策略可以使有着不同技能的用户追求共同的利益。双赢的方式应该被鼓励。例如,上传实验数据集可以换取建模工具,这会推动进一步建模。不过,需要规定明确的协议,以管理数据使用伦理等。
对于MGI基础设施的投资者来说,信息使用最大化有着最主要的吸引力。例如,从国家的同步加速器和中子衍射设施中得到的实验数据集,应该在最大程度上得到存档和使用,以供搜索与引用,大型超级计算机模拟器得到的数据也应如此。
开放获取的规则是可取的,可以遵循美国国家科学基金会所赞助的关于纳米级建模与仿真工具的nanoHUB项目,以及LAMMPS分子动态代码和DREAM.3D软件的范例。
Amanda Barnard:拥抱不确定性
澳大利亚联邦科学与工业研究所所长
MGI正在形成协同工作的风格,这提高了技术与个人所面临的挑战。材料科学家必须更加适应不确定性。他们必须放弃控制欲,相信他们的同事,抗拒那种“让所有事情都确定”的冲动。
从现有数据中得到新的科学成果需要集中资源。一些见解和突破只能通过特定的方式达到,其他方式无法完成。电子显微镜可以发现亚原子表面的特性,而光学显微镜可以显示光如何从亚原子表面上被反射。
结合不同来源的成果十分困难。错误通常来自实验或计算技术本身的特性。许多实验人员都了解当实验结果随着实验室条件的变化而变化时有多沮丧,甚至连那些基于理论的计算方法都可能会得到不同的答案。
与单纯将源于纯数据集的测量或统计错误进行综合相比,将不同来源的数据混合通常会带来更多的不确定性。若想从数据共享中受益,我们必须学会适应这种情况。
MGI使用者必须要适应的另一种不确定性是人为因素,即我们对创造原始数据的人们及其能力的看法。科学家应该习惯客观的怀疑。为了快速推进材料研究,我们需要假设每个贡献者都非常有能力,并让数据本身来说话。
只有当我们能够像给予MGI数据那样轻松并且自信地从MGI获得数据时,MGI的价值才能得以体现。
Francois Gygi:使模拟可再生
加州大学戴维斯分校计算机科学教授
MGI所得到的最快速的回报应该来自于对材料结构模拟的共享。
数值模拟并不像其理论和计算机基础所显示的那样可靠和可再生。由于近似值以及使用参数数量的复杂性,它们经常会给出不同的结果。
克服这些困难对于设计新材料来说是必不可少的。例如,来自对一种材料晶格缺陷形成模拟的预测,可以改善我们优化材料强度或者电子特性的能力。
数据只有在得到独立证实,并由不同的研究团队成功复制的情况下才是可靠的。自由地共享数据将使这种交叉验证成为可能。
在传播模拟数据时,研究人员必须谨记两点。首先,模拟软件应该可以公开访问,而不只是数据。软件供应商不能禁止原始数据或性能数据的。第二,通用数据格式和集中的数据库并不总是必要的。材料研发团队可以采用现有的框架来共享数据。
在适度的投资下,研究人员可以在自己的服务器上发布数据,其他人也可以访问这些数据。通过鼓励特定领域网络工具的开发,我们将会减少数据交互检验和验证的障碍。
Peter B. Littlewood: 发掘多样性
伊利诺伊州阿贡国家实验室物理科学与工程实验室助理主任
从同步加速器到电子扫描显微镜,纳米技术工具在信息革命中得到了磨炼。如今,在MGI中,我们需要通过扩大视野并纳入多种多样的材料来推进分子制造。
这一过程存在基本的障碍。尽管MGI的名字听起来雄心勃勃,但实际上,原子并不同于基因。生物基因组既是一种理论,又是一种执行算法。在材料科学中,量子力学可以使从编码到功能的完美翻译毁于一旦。
这种理论僵局仅仅反映了材料的多样性。组成或者结构上的微小变化可以产生全新的功能。
不过化学是系统性的。自从门捷列夫制定元素周期表以来,我们接触了材料结构和功能的不同形式,现在可以借助强大的计算机和高通量实验进行筛选。我们正在建造一个与材料种类、特性和功能相吻合的工具包。MGI将会扩大其范围。(张冬冬)
《中国科学报》 (2013-12-04 第3版 国际)