PET-MAD:一种轻量级通用原子间势函数及其在先进材料模拟中的应用

《Nature Communications》:PET-MAD as a lightweight universal interatomic potential for advanced materials modeling

【字体: 时间:2025年11月28日 来源:Nature Communications 15.7

编辑推荐:

  本刊推荐一项关于通用机器学习原子间势函数(MLIP)的前沿研究。针对现有通用势函数训练数据量大、偏向低能构型且电子结构参考不一致的问题,研究团队开发了基于点边变换器(PET)架构和原子多样性大数据集(MAD)的PET-MAD势函数。研究表明,该模型仅用不到10万个结构训练,却在多个基准测试和六种材料的复杂模拟中展现出与最先进模型相媲美的精度,同时适用于分子、有机材料及表面体系,为跨领域材料模拟提供了高效、可靠的解决方案。

  
在材料科学和化学领域,原子尺度模拟是理解材料性质、设计和发现新材料的强大工具。第一性原理计算,如密度泛函理论(DFT),虽然精度高,但其巨大的计算成本严重限制了可模拟体系的尺寸和时间尺度。机器学习原子间势函数(MLIP)应运而生,旨在以较低的计算成本逼近DFT的精度,从而扩展原子模拟的边界。传统的MLIP通常是为特定体系“量身定制”的,开发每个新势函数都需要大量的DFT计算和专业知识。近年来,通用型或“万能”势函数开始出现,它们目标是在整个元素周期表范围内提供定性的描述。然而,这些模型往往存在一些局限性:它们通常基于庞大的、侧重于稳定材料的数据库进行训练,可能对高能、非平衡构型的预测能力不足;更重要的是,不同模型所使用的DFT计算设置不一致,使得难以区分模型本身的误差和参考数据不一致带来的偏差。因此,开发一个基于内部一致的高质量数据、结构紧凑且具有高度化学和结构多样性的通用势函数,成为该领域一个重要的挑战。
针对上述问题,洛桑联邦理工学院(EPFL)计算科学与建模实验室的Michele Ceriotti教授团队在《Nature Communications》上发表了他们的研究成果。他们引入了一种名为PET-MAD的新型通用机器学习原子间势。该模型结合了一个精心设计的、旨在最大化原子多样性的数据集——大规模原子多样性(MAD)数据集,以及一种表达能力强、基于Transformer的图神经网络架构——点边变换器(PET)。尽管PET-MAD仅使用了不到10万个结构进行训练(比当前最先进的通用模型少2-3个数量级),并且模型架构轻量(约280万个参数),但它在无机固体、分子、有机材料和表面等多种体系的基准测试中表现出与最先进模型相竞争的精度。更重要的是,研究通过六个具有挑战性的案例研究(包括锂硫代磷酸盐中的离子输运、砷化镓的熔点、高熵合金的表面偏析、液态水的核量子效应、琥珀酸的核磁共振晶体学以及钛酸钡的介电响应),全面验证了PET-MAD在复杂原子模拟中的可靠性、稳定性和速度,能够用于研究热涨落、量子核效应、功能性质和相变等。此外,该模型还集成了低成本的不确定性量化功能,并可以通过低秩自适应(LoRA)技术进行高效微调,以极少的额外计算量实现特定体系的量子力学精度。
为开展此项研究,作者主要应用了以下几项关键技术:首先,构建了大规模原子多样性(MAD)数据集,该数据集包含约9.6万个结构,涵盖85种元素,整合了稳定的无机/有机固体、表面、团簇、分子晶体以及通过随机扰动和元素替换产生的高畸变构型,所有数据均使用统一的DFT设置(基于Quantum ESPRESSO软件和PBEsol泛函)进行计算,确保了内部一致性。其次,采用点边变换器(PET)这一不受严格旋转不变性约束的图神经网络架构来拟合原子间势,该架构具有高表达能力和较低的推理成本。第三,利用低秩自适应(LoRA)这一参数高效的微调技术对预训练的PET-MAD模型进行特定体系的优化。第四,结合最后层预测刚性(LLPR)方法实现低成本的不确定性量化,并利用浅集成进行误差传播。最后,研究运用了多种先进的模拟协议,如结合蒙特卡洛原子交换的副本交换分子动力学(REMD/MC)、路径积分分子动力学(PIMD)以及界面钉扎法等,来评估模型在复杂物理场景下的性能。

模型架构与训练

PET-MAD模型基于PET架构,这是一种基于Transformer的图神经网络,不强制严格的旋转不变性,而是通过数据增强近似学习这种对称性。研究者通过广泛的超参数搜索,确定了最终模型结构:截断半径为4.5 ?,2个消息传递层,每个包含2个Transformer层,令牌维度为256。整个模型约有280万个参数。MAD数据集被按子集随机打乱后,以8:1:1的比例划分为训练集、验证集和测试集。训练使用Adam优化器,历时约40小时。最终模型在测试集上的能量和力预测平均绝对误差分别为14.7 meV/原子和72.2 meV/?。

基准测试

研究首先在Matbench Discovery基准上评估了PET-MAD的数据效率。
结果表明,PET-MAD显著推进了帕累托前沿,仅使用少1-3个数量级的训练数据就达到了如SevenNet和GNoME等先进模型的精度。当使用不一致的DFT参考时,误差增大三倍,凸显了一致性基准的重要性。
随后,研究者在多个公开数据集上比较了PET-MAD与四种广泛使用的通用势函数(MACE-MP-0-L, MatterSim-5M, Orb-v2, SevenNet-l3i5)。
PET-MAD在预测MAD数据集自身时优势明显,尤其在分子子系统(SHIFTML-molcrys, SHIFTML-molfrags)和畸变结构(MC3D-rattled, MC3D-randcomp)上显著优于其他模型。在无机晶体数据集(如MPtrj, Alexandria)上,PET-MAD与部分模型表现相当,而Orb-v2在其训练集包含的数据集上表现最佳。在分子数据集(SPICE, MD22)上,PET-MAD表现最优。PET-MAD的旋转预测差异远小于其预测误差,表明其近似对称性保持良好。
在计算效率方面,
PET-MAD在分子动力学模拟中的吞吐量高于所有对比的保守性势函数,甚至可与非保守性的Orb-v2竞争,当其使用直接力预测功能时,速度可再提升2-3倍。

案例研究

锂硫代磷酸盐中的离子输运
研究模拟了Li3PS4的α、β和γ相在不同温度下的离子电导率σ。
PET-MAD的结果与专门训练的势函数(PET-Bespoke)及微调模型(PET-MAD-LoRA)高度一致,定量地捕捉到了PS4四面体旋转导致的行为变化,仅对γ相的相变温度略有高估。
砷化镓的熔点
采用界面钉扎法计算化学势差Δμ,以确定GaAs的熔点。
专用模型和微调模型预测的熔点几乎相同(1169±3 K vs 1169±4 K),而PET-MAD预测值稍低(1111±72 K)。LLPR集成不确定性量化成功反映了PET-MAD与更精确模型之间的差异。
高熵合金中的表面偏析
研究模拟了CoCrFeMnNi高熵合金(111)表面的元素偏析。
PET-MAD和微调模型得到了几乎相同的偏析模式(表面富镍),与文献结果一致,而专用模型可能因训练数据量较小存在过拟合。
液态水中的核量子效应
通过路径积分分子动力学(PIMD)研究核量子效应(NQE)对水结构(径向分布函数)和热容的影响。
PET-MAD与专用模型在经典和量子模拟中均表现出极好的一致性,但其结果继承了GGA泛函高估水熔点的倾向,导致室温下模拟的实际上是过冷液体。
琥珀酸中的核量子效应与NMR晶体学
研究核量子涨落对琥珀酸晶体中1H核磁共振(NMR)化学位移的影响。
PET-MAD、专用模型和微调模型给出的化学位移分布几乎完美重合,核量子效应导致氢键质子化学位移分布显著展宽和下移,与使用专用势函数的研究结论一致。
钛酸钡的介电响应
研究通过柔性原胞分子动力学模拟BaTiO3(BTO)的相变和介电性质。
PET-MAD准确识别了BTO的菱方(R)、正交(O)、四方(T)和立方(C)相,预测的相变温度与专用模型高度一致(最大偏差<30 K)。计算的静态介电张量也显示出与专用模型相似的行为,仅在T相略微低估,C相曲线偏移约25 K。
PET-MAD的成功证明,通过追求数据集内部的一致性和高度的结构/化学多样性,而非单纯追求数据量,可以训练出高效、准确的通用机器学习原子间势。其轻量级架构、高计算效率以及内置的低成本不确定性量化和高效微调能力,使其成为一个强大而易于使用的工具。这项研究为未来通用势函数的数据集设计和模型架构发展提供了重要指导,有望推动材料模拟和发现进入一个更可持续、更易访问的新阶段。PET-MAD作为一个功能丰富的框架,为跨越多类材料和复杂模拟协议的高级原子模拟提供了可靠引擎,有望在材料设计和发现中发挥关键作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号