一种用于预测铁基金属玻璃饱和磁通密度的深度循环学习框架

《Journal of Non-Crystalline Solids》:A deep recurrent learning framework for predicting saturation magnetic flux density in Fe-based metallic glasses

【字体: 时间:2025年12月05日 来源:Journal of Non-Crystalline Solids 3.5

编辑推荐:

  铁基非晶合金的饱和磁通密度预测研究采用深度循环神经网络(RNN/LSTM/GRU)直接学习元素组成数据,实现R2达0.95的优异预测性能,并通过SHAP分析揭示关键元素贡献机制,为高效合金设计提供新工具。

  
吴一成|严磊|马晨博|高鹏帅|王东鹏
江苏科技大学机械工程学院,镇江212100,中国

摘要

铁基金属玻璃(MGs)具有优异的软磁性能,但由于组成设计空间庞大以及传统实验方法的效率低下,确定高饱和磁通密度(Bs)的成分仍然是一个重大挑战。传统的机器学习(ML)模型已被用于加速这一过程,但它们依赖于手工设计的描述符,这限制了它们在多种合金系统中的泛化能力。在这项研究中,我们开发了一个端到端的深度循环学习框架,包括基本的循环神经网络(RNN)、长短期记忆(LSTM)和门控循环单元(GRU)架构,直接从元素组成数据预测Bs。这些模型自动从原始的原子百分比向量中提取特征表示,无需手动构建特征。使用一个精心策划的实验报告的铁基MGs数据集,LSTM和GRU模型在测试集上的R达到了0.95,优于代表性的传统ML算法。此外,我们采用了SHapley加性解释(SHAP)来提高模型的可解释性,定量揭示了合金元素在控制Bs方面的相对重要性。这些发现提供了关于组成效应的机制性见解,并展示了可解释的深度循环学习模型作为数据驱动的发现和优化具有增强磁性能的铁基MGs的有效工具的潜力。

引言

与传统结晶硅钢相比,铁基金属玻璃(MGs)由于其低矫顽力、高磁导率和较低的核心损耗而受到了广泛关注[1,2]。然而,它们更广泛应用的一个关键瓶颈在于其通常较低的饱和磁通密度(Bs),这限制了它们在高功率密度应用中的使用[3]。铁基MGs庞大的高维组成空间为调节Bs提供了机会,但传统的试错策略效率低下,且缺乏将组成与性能相关联的稳健框架,从而阻碍了铁基MGs的合理设计[3]。
近年来,机器学习(ML)作为材料科学中的一个变革性方法出现,通过从数据中学习复杂的非线性关系来加速材料的发现[[4], [5], [6], [7]]。在MGs的背景下,ML已成功应用于预测玻璃形成能力(GFA)[[8], [9], [10], [11], [12]]、机械强度[13,14]以及MGs的软磁性能[[15], [16], [17]]。然而,传统的ML模型通常依赖于手工制作的描述符,如原子半径方差、电负性差异或混合焓,这些描述符需要丰富的领域专业知识,并且可能无法很好地泛化到化学性质多样的系统中[18,19]。
深度学习(DL)提供了一种端到端的替代方法,它可以直接从原始数据中自动学习多层次的特征表示[20],从而消除了手动特征工程的需要。它在材料领域取得了显著的成功,包括预测相形成[21]、GFA[22,23],甚至具有高Bs的铁基MGs的逆向设计[24]。特别是循环神经网络(RNN)及其变体,即长短期记忆(LSTM)和门控循环单元(GRU),由于其强大的时间和上下文建模能力,非常适合从序列或组成数据中学习[20,[25], [26], [27], [28]]。然而,它们在预测铁基MGs磁性能方面的潜力尚未得到充分探索。此外,现有的DL应用在材料科学中通常作为黑盒预测器运行,且没有先前的研究系统地解决了组成-性能建模的可解释性问题,这限制了它们在指导合理合金设计中的实际效用。
在这项研究中,我们提出了一个基于组成的深度循环学习框架来预测铁基MGs的Bs。我们的方法直接以元素组成序列作为输入,并自动学习了预测特征,避免了手动构建描述符的需要。我们评估了几种深度循环学习模型(RNN、LSTM和GRU),并使用一个精心策划的实验报告的铁基MGs数据集对它们的性能进行了基准测试。结果表明,LSTM和GRU模型在测试集上的决定系数(R)达到了0.95。为了提高可解释性并获得机制性见解,我们采用了SHapley加性解释(SHAP)来量化各个合金元素对模型预测的贡献。这种方法揭示了控制Bs的关键组成效应,从而为设计具有定制磁性能的先进铁基MGs提供了可行的见解。

数据收集

数据收集

我们编制了一个包含535种铁基MG组成的综合数据集,这些数据来自先前发表的实验研究,每个条目都包含了精确的元素比例和相应的Bs值。为了确保数据的可靠性,排除了信息不完整的数据,并对同一合金在不同来源报告的值进行了平均,以减少来源间的差异。所有数据条目都包含在补充材料中。如图1所示,该数据集

结果与讨论

数据集被随机分为训练集(80%)和测试集(20%)。在训练之前,所有输入特征都使用Z分数标准化进行了归一化,以消除尺度差异,从而加快了收敛速度并提高了预测性能。模型训练是通过使用Adam优化器迭代最小化MSE损失来进行的。
为了比较不同循环架构的训练动态并确定最佳训练周期,图5展示了

结论

在这项研究中,我们开发并评估了一个深度循环学习框架,直接从铁基MGs的元素组成预测其Bs。基于RNN、LSTM和GRU的双向架构被实现,使用原子百分比向量作为输入,使模型能够在无需手工特征工程的情况下学习组成模式。在测试的模型中,LSTM和GRU展示了卓越的预测性能,在测试集上达到了R为0.95

数据可用性

我的数据已分享在补充材料中。

CRediT作者贡献声明

吴一成:写作——审稿与编辑、监督、资源提供、方法论、概念化。严磊:写作——初稿撰写、可视化、验证、软件开发、调查。马晨博:软件开发。高鹏帅:软件开发。王东鹏:资源提供。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号