基于迁移学习的自主材料探索系统网络化:加速功能材料发现的新范式
《npj Computational Materials》:Networking autonomous material exploration systems through transfer learning
【字体:
大
中
小
】
时间:2025年12月10日
来源:npj Computational Materials 11.9
编辑推荐:
本文推荐一项发表于《npj Computational Materials》的创新研究。针对当前自主材料探索系统孤立运行、效率受限的问题,研究人员开发了一种通过迁移学习(Transfer Learning)实现系统网络化的框架。该研究将三个分别专注于磁矩(M)、居里温度(Tc)和自旋极化度(Sp)的自主系统(ASM, ASTc, ASSp)联网,演示表明知识共享能显著提升材料探索效率,且通过最佳模型选择(BPM)机制有效避免了负迁移。这项工作为构建大规模协同自主材料发现网络奠定了基础。
在新材料发现这场科技竞赛中,人类正面临着一个前所未有的挑战:随着材料科学的发展,候选材料的搜索空间正呈指数级增长。传统的“手动”研究模式——即研究人员亲手合成材料、测量性能、再根据数据决定下一步研究方向——在这种庞杂的搜索空间中已显得力不从心。正如文档中图1a所描绘的传统人类驱动材料探索循环,这种模式虽然能积累知识,但效率低下,难以应对现代材料开发的节奏。
为了突破这一瓶颈,融合了机器人技术、材料模拟和机器学习(特别是主动学习)的自主材料探索系统应运而生。这些系统主要分为两大类:一类是自主机器人材料探索系统(图1b),通过机器人平台自动执行材料合成与性能表征,机器学习算法分析数据并决策下一个候选材料,形成无需人工干预的闭环;另一类是基于模拟的自主材料探索系统(图1c),例如结合密度泛函理论(Density Functional Theory, DFT)计算与机器学习,在虚拟空间中高效探索材料。尽管这些系统在全球范围内不断发展并在物理和虚拟环境中运行,但它们通常处于“孤岛”状态,彼此独立运行,缺乏协作,这极大地限制了其整体效率。
这不禁让人联想到人类研究者的工作方式。如图1d所示,三位分别专注于磁矩(M)、居里温度(Tc)和自旋极化度(Sp)的研究者,除了独立进行合成-表征-分析的迭代循环外,还会通过讨论和交流见解来相互启发,从而提升发现效率。这种跨学科知识交换的重要性,恰恰是当前大多数自主系统所缺失的。
那么,能否让这些“AI科学家”也像人类一样协作起来呢?由Naoki Yoshida、Yutaro Iwabuchi、Yasuhiko Igarashi和Yuma Iwasaki等研究人员在《npj Computational Materials》上发表的最新研究,给出了肯定的答案。他们提出并验证了一种创新框架,使多个自主材料探索系统能够通过迁移学习形成网络,实时选择性地利用来自其他系统的相关知识,从而显著加速材料发现进程。
本研究为验证自主材料探索网络的有效性,核心采用了以下几项关键技术:1) 构建了三个分别以磁矩(M)、居里温度(Tc)和自旋极化度(Sp)为优化目标的自主探索系统(ASM, ASTc, ASSp)。2) 采用集成神经网络(Ensemble Neural Networks, ENNs)作为基础预测模型,每个集成模型由10个独立的前馈神经网络(FNNs)构成,用于预测目标属性并估计预测不确定性。3) 引入了迁移学习(Transfer Learning)机制,通过微调(fine-tuning)在其他系统上预训练的模型(如将ASTc的ENN模型迁移至ASM),实现知识跨系统迁移。4) 设计了最佳模型选择(Best Performing Model, BPM)机制,通过比较验证损失(validation loss)从候选模型(包括非迁移模型和迁移学习模型)中选择最优者,以避免负迁移(negative transfer)。5) 使用上置信界(Upper Confidence Bound, UCB)作为采集函数(acquisition function)来指导贝叶斯优化(Bayesian optimization)过程。演示所用数据集来源于高通量DFT计算获得的16,908种B2结构三元合金的性能数据。
研究团队设计了一个包含三个自主系统(ASM, ASTc, ASSp)的网络,并通过迁移学习实现知识共享。图2a展示了ASM在自主材料探索网络中的算法流程。系统从少量初始观测数据(10个材料)开始,构建初始数据集,并基于此训练集成神经网络模型(ENM)。ENM不仅能提高预测精度,还能估计预测不确定性。随后,系统会构建迁移学习模型(TLM),例如TLMTc→M(图2e)和TLMSp→M(图2f),这些模型通过冻结预训练模型(如ENMTc)的前几层并微调输出层,将其他目标属性(Tc, Sp)的知识迁移到当前目标属性(M)的预测中。
为了评估所提出网络的有效性,研究团队使用源自高通量DFT计算的大型数据集(包含16,908种B2结构三元合金的Sp, Tc, M值)进行了演示。考虑到不同属性测量的实验复杂性差异,三个自主系统的探索速度被设置为不同:ASM最快,ASTc次之,ASSp最慢。
图3a-c分别展示了ASSp、ASTc和ASM在启用迁移学习网络(红色)与仅使用本地数据(蓝色)情况下的自主探索进程。结果显示,对于ASSp和ASTc,网络化方法显著提高了探索效率,能更快地发现高性能材料。例如,ASSp达到地面真实值90%所需的平均观测次数,在网络化条件下为17.4次,而非网络化条件下为24.9次。ASTc也观察到类似的效率提升。然而,对于ASM,网络化并未带来显著改善,其探索效率与仅使用本地数据相当。这表明网络化的益处可能因目标系统和其数据积累速度而异。
图4a-c进一步分析了验证损失(Vloss)的演变以及迁移学习的时机、频率和方向。在ASSp和ASTc中,启用迁移学习后,验证损失显著降低,且系统频繁选择来自其他系统的迁移学习模型作为BPM(图4a-b中的绿色和橙色点),表明外部知识被有效利用。特别是在ASTc中,来自数据积累更快的ASM的知识被频繁转移。相反,在ASM中(图4c),迁移学习带来的改善不明显,且在探索后期,非迁移模型(ENMM)几乎被持续选中,这与其自身数据积累较快,本地模型性能已足够优越有关。
研究还评估了BPM对整个搜索空间中未观测材料的泛化性能(图5a-c)。总体而言,网络化方法在ASSp和ASTc上带来了泛化性能的提升。在ASTc和ASM的探索后期,由于贝叶斯优化导致的采样偏差(训练集偏向高性能材料),非网络化设置的泛化性能出现下降,而网络化设置在一定程度上缓解了这种下降,显示出其对采样偏差的鲁棒性。
迁移学习的有效性通常建立在目标属性间存在关联的基础上。图6a-c展示了M、Tc、Sp三者之间的散点图。分析表明,这些属性之间存在一定程度的关联性:Sp与Tc存在分布上的依赖关系(图6a);M与Sp呈现弱相关趋势(图6b);M与Tc则显示出明显的正相关性(图6c)。这些关联为在它们之间应用迁移学习提供了合理性。
本研究成功证明,通过迁移学习将自主材料探索系统网络化,可以显著提高材料发现的整体效率。关键在于,所提出的框架通过BPM选择机制,能够自动抑制来自数据不足或属性关联性弱的系统的负迁移,确保网络化绝不会降低单个系统的性能,只会带来增益或保持原有效能。
这项工作具有深远的意义。首先,它为构建大规模、分布式、协同工作的自主材料探索网络提供了可行的技术框架,有望极大加速新功能材料的发现。其次,分析网络内知识转移的频率、时机和方向性,可以定量评估不同材料系统或属性之间的内在联系,这可能催生新的科学见解,甚至促进不同研究领域之间的合作。
当然,将这一概念推向实际应用仍面临挑战,例如开发更具普适性的材料描述符、建立通信协议与元数据管理标准、探索更高效的机器学习算法等。但无论如何,这项研究为材料科学领域迈向更智能、更协同的研发未来指明了一个充满希望的方向。随着全球范围内自主材料探索系统的日益普及,实现这些系统的互联与协作能力将变得至关重要。本研究提出的方法为分布式、协作式、数据驱动的材料探索提供了一个可扩展且稳健的基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号