通过带有温度编码虚拟节点的图神经网络对氧化物玻璃的热膨胀进行预测

《Materials Today Physics》:Thermal expansion prediction in oxide glasses via graph neural networks with temperature-encoded virtual nodes

【字体: 时间:2025年12月01日 来源:Materials Today Physics 9.7

编辑推荐:

  提出PPPM-GNN物理信息图神经网络框架,通过引入温度编码虚拟全局节点解决传统GNN过长程依赖建模难题,有效抑制过压缩和过平滑现象,结合GAT多层结构实现局部与全局信息协同处理,在四元氧化物玻璃热膨胀系数预测中表现优异,R2达0.9703。

  
黄明|熊静娴|彭永倩|毛海军|刘卓峰|李伟|王凤林|张伟军|陈星宇
中国国防科技大学航空航天科学与工程学院材料科学与工程系,长沙

摘要

由于传统图神经网络在捕捉长程依赖性时存在过度压缩和过度平滑的问题,预测氧化物玻璃的热膨胀系数(CTE)颇具挑战性。在此,我们开发了PPPM-GNN,这是一种基于物理原理的框架,它引入了一个温度编码的虚拟全局节点,以直接整合全局结构信息并将热信息广播到所有原子节点。经过训练后,该方法能够准确预测四元氧化物玻璃系统的经典分子模拟计算结果。此外,该框架具有可解释性,因为注意力可视化揭示了从局部交互到跨层任务特定路径的物理意义上的学习模式。同时,我们展示了这种结构如何促进在先前未探索的组成领域中的强大泛化能力。这一框架为解决需要建模热效应和远距离原子相互作用的复杂材料科学问题奠定了基础。

引言

图神经网络(GNN)已成为模拟玻璃材料和非晶系统的变革性技术,提供了预测性质和结构的能力[[1], [2], [3], [4]]。然而,长程库仑相互作用在决定含有混合离子-共价键的玻璃的宏观特性方面起着关键作用。尽管GNN通过图结构中局部邻域信息的逐层聚合来本质上模拟短程原子相互作用,但在捕捉远距离节点之间的长程力时遇到了显著困难。增加卷积层的数量或延长消息传递距离会导致图架构内的过度压缩现象,即节点表示变得越来越均匀,关键信息受到过度压缩。这被称为过度压缩和过度平滑问题。为应对这些挑战,准确模拟无序系统中的长程库仑力对于预测非晶材料的行为变得至关重要。
一些研究人员提出了不同的策略来捕捉原子系统中的长程相互作用。Bin Shao等人构建了一个包含“原子级过程”和“网格到原子”组件的双层架构,以捕捉无序原子系统中的短程和长程相互作用。这种方法将传统的基于网格的计算操作转化为可学习的参数,这种神经网络对原子和网格数据的整合显示出了巨大的潜力[5]。平行的研究工作集中在将原子数据投影到有限数量的节点上,以表示集体分子信息。信息在这些神经节点之间显式交换,投影回原子表示作为增强手段。通过这种机制,神经网络建立了远距离节点之间的直接通信链接,使得任何节点对都可以在单跳内进行交互[6]。这种方法类似于分子动力学中的粗略技术,避免了在多跳方法中建模长程相互作用时出现的信息丢失和平滑伪影。这两种原子系统中的长程相互作用建模方法都取得了显著的成就,但它们仍存在某些根本性限制。Neural P3M存在计算可扩展性问题,因为其众多的可训练网格参数导致训练成本随着网格大小的增加而迅速增加,限制了其在大规模原子系统中的应用。相反,虽然Neural Atoms能够从训练数据中自主学习原子聚类,但支配这些分组的物理和化学原理并不透明且难以解析。
因此,为了解决传统GNN在捕捉长程库仑相互作用方面的局限性及其模型可解释性差的问题,我们开发了PPPM-GNN架构来预测玻璃材料的热膨胀系数。在这种方法中,通过PPPM算法计算出的长程库仑力被直接作为节点特征纳入,避免了由于网络深度增加而导致的过度压缩问题。同时,引入了一个具有双重功能的温度全局节点:首先,将材料温差信息编码以促进与状态变量相关的性质计算;其次,在所有原子节点之间建立了直接连接,将原子间最短路径缩短为两步,从而实现了高效的长程信息传输通道。通过与三层GAT架构的集成,可以同时处理局部化学环境和全局长程效应。实验结果表明,通过显式结合物理约束和优化拓扑结构,PPPM-GNN在玻璃CTE预测方面取得了优异的性能,为基于物理原理的图神经网络设计提供了新的见解。

结果

在传统的图神经网络中,每个节点的嵌入是通过卷积或消息传递来更新的。在这种框架下,当模型想要从远距离节点获取信息时,只能通过重复卷积或重复消息传递过程来实现。然而,来自长程依赖性的信息面临两个重大挑战:当通过节点瓶颈压缩时,信息可能会被扭曲(这种现象称为过度压缩),或者在传递过程中被稀释

结论

在这项工作中,我们成功开发了PPPM-GNN架构来预测氧化物玻璃系统的CTE。我们的方法通过一个温度编码的虚拟全局节点解决了传统图神经网络的根本局限性,该节点减轻了过度压缩和过度平滑问题,同时实现了高效的长程信息传播。PPPM-GNN在四元玻璃系统上表现良好,训练集和测试集的R2值分别为0.9703和0.9089。

玻璃结构和CTE数据准备

所有分子模拟均使用LAMMPS和周期性边界条件进行[18]。玻璃系统采用Buckingham势模型,并通过PPPM求和来处理长程库仑相互作用。玻璃的初始配置是通过随机分布原子(包括SiO2、Al2O3、CaO、ZrO2、Li2O、Na2O、K2O)构建的。熔化-淬火过程包括:1) 在5000 K下进行高温平衡(NVT,500,000步)。2) 逐步冷却至300K

CRediT作者贡献声明

黄明:概念化、方法论、研究、写作——原始草稿。熊静娴:数据整理、形式分析、软件、可视化。彭永倩:资源获取、验证、写作——审阅与编辑。毛海军:写作——审阅与编辑、原始草稿、可视化、验证、形式分析、数据整理、概念化。刘卓峰:研究、方法论、软件。李伟:形式分析、验证、数据整理。王凤林:监督

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

致谢

作者(黄明)感谢中国留学基金委(授权号:202406110041)提供的财政支持
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号