利用基于云的材料加速平台实现主动学习路径依赖特性

《Digital Discovery》:Active learning path-dependent properties using a cloud-based materials acceleration platform

【字体: 时间:2025年11月06日 来源:Digital Discovery 5.6

编辑推荐:

  材料加速平台通过迭代期望信息增益优化路径依赖实验设计,结合云服务与自动化实验室系统实现多步光谱电化学实验的高效探索,成功定位了Co–Ni–Sb)Oz金属氧化物光稳定电位窗口。

  在现代科技中,固态材料扮演着至关重要的角色,尤其是在需要应对多种环境条件的应用场景中。由于这些材料的性质往往随着所经历的环境序列而变化,并且这种变化通常是不可逆的,因此在实验过程中,材料的性能表现出显著的路径依赖性。这种特性意味着,不同实验路径可能会导致不同的结果,从而影响对材料状态的理解和预测。为了应对这一挑战,研究者们开发了一种新的实验设计方法,即“迭代期望信息增益”(iterated expected information gain, iEIG)获取函数,以优化整个实验轨迹,从而在材料探索中实现更高效和精准的决策。

iEIG 获取函数的提出源于对传统实验设计方法的改进。在许多情况下,研究人员采用的是基于固定环境路径的实验设计,这种方法在面对路径依赖性问题时显得不够灵活。例如,在研究电化学稳定性或腐蚀行为时,实验条件的顺序和持续时间直接影响材料最终状态。而传统的主动学习策略通常假设实验结果与当前状态相关,但忽略了路径依赖性对后续实验的影响。因此,为了更全面地理解材料的动态行为,研究者引入了 iEIG 方法,该方法不仅关注单个实验点的信息增益,还综合考虑了实验路径上各步骤之间的相互影响。这使得在设计实验时,可以更有效地预测哪些路径更有可能提供新的信息,同时降低因不稳定现象导致实验提前终止的风险。

iEIG 方法被集成在一个基于云的材料加速平台(Materials Acceleration Platform, MAP)中,该平台采用了事件驱动的、具有状态记忆的中间件(broker)结构,结合远程部署的 HELAO(Hierarchical Experimental Laboratory Automation and Orchestration)系统和一个 AI 驱动的科学管理模块,形成了一个闭环的实验自动化流程。这种架构允许平台在多个机构间协调资源,实现分布式实验管理。此外,通过事件驱动的方式,平台能够记录完整的实验过程,确保数据的可追溯性和完整性,这对现代云数据处理流程(如 AWS、Azure 和 GCP)至关重要。iEIG 获取函数的应用不仅提升了实验设计的智能化水平,还使得平台能够动态调整实验策略,从而更高效地探索复杂的材料参数空间。

为了验证 iEIG 方法的有效性,研究团队在 (Co–Ni–Sb)Oz 金属氧化物中开展了一个案例研究,目标是通过多步光谱-电化学实验确定光学稳定的电位窗口。该实验采用了自动化的实验设备和高通量操作流程,包括精确控制的电位扫描、自动填充电解液以及实时光谱测量。通过这种方式,研究人员能够在不同电位下对材料进行测试,并记录其光学不稳定度的变化。iEIG 获取函数在实验设计中起到了关键作用,它不仅帮助选择具有最大信息增益的实验点,还评估了实验路径中可能遇到的不稳定风险,从而确保实验的连续性和可靠性。

实验过程中,平台利用 AWS 的数据存储和事件处理功能,实现了实验数据的高效管理和实时更新。例如,每当实验完成并上传数据到 AWS S3 时,一个 AWS EventBridge 触发器会调用一个 AWS Lambda 函数,将实验的元数据(包括原始数据的位置和实验细节)插入到“实验室数据表”(lab table)中,以确保数据的可追溯性。同时,另一个 Lambda 函数负责数据处理和性能指标的生成,并将这些指标与对应的实验请求关联。整个过程形成了一个闭环系统,使得 AI 模型能够根据实时反馈不断优化实验设计。

在实验设计方面,研究团队使用了一种基于高斯过程(Gaussian Process, GP)的贝叶斯模型,用于预测材料的光学不稳定度。该模型能够在实验过程中不断更新,以适应新的数据输入。同时,iEIG 获取函数通过计算实验路径上每个步骤的信息增益,帮助 AI 模型选择最合适的实验点。这一过程涉及对实验历史的考量,因为未来的实验结果不仅依赖于当前状态,还受到之前实验路径的影响。因此,iEIG 方法不仅关注单点信息增益,还综合评估了整个路径上的信息获取潜力,从而在复杂材料探索中实现了更全面的优化。

在实际应用中,iEIG 方法被证明能够有效应对路径依赖性带来的挑战。例如,在对不同材料组成和 pH 值的实验中,iEIG 能够根据模型的不确定性,优先选择那些能够提供最大信息增益的实验点。这种策略在多步实验中尤为重要,因为每个实验步骤都可能对后续结果产生影响。通过这种方式,研究人员能够在较短时间内获得更精确的材料性能数据,从而加快材料发现和优化的速度。

此外,研究团队还采用了多种评估方法来验证 iEIG 方法的有效性。一方面,他们利用在线误差指标,评估模型在实验过程中的预测能力。这种方法可以在实验进行过程中实时计算模型的预测误差,而不必等到实验结束。另一方面,他们还使用了离线误差评估,即在实验完成后,利用一个未参与训练的测试数据集(held-out dataset)来衡量模型的整体性能。这些评估方法共同揭示了 iEIG 方法在提升实验效率和准确性方面的潜力。

在实验过程中,研究人员还观察到了一些有趣的现象。例如,在实验初期,由于模型缺乏足够的数据,预测误差相对较高。然而,随着实验的推进,模型逐渐积累数据,并在多个实验场景中表现出持续的误差下降趋势。这一现象表明,iEIG 方法能够有效地引导模型学习,并在不断优化实验路径的同时提高预测精度。此外,当实验空间从二元系统扩展到三元系统时,模型的误差会出现短暂上升,但随后又迅速下降,说明模型具备良好的适应能力,能够处理更复杂的材料系统。

iEIG 方法的另一个重要优势是其对实验路径中潜在不稳定因素的识别和规避。在许多实验中,材料可能会因环境条件的变化而发生不可逆的结构或性能变化,这可能导致实验提前终止。通过在获取函数中引入稳定性预测,iEIG 方法能够在实验设计阶段就考虑到这些风险,从而选择更稳定的实验路径。这种方法不仅提高了实验的可靠性,还减少了实验失败的可能性,为大规模材料探索提供了有力支持。

整个研究过程不仅展示了 iEIG 方法在实验设计中的有效性,还验证了基于云的材料加速平台在管理复杂、适应性强的实验流程方面的潜力。该平台结合了 AI 驱动的实验设计、远程实验室自动化和云数据基础设施,使得实验过程更加高效和智能化。通过这种整合,研究人员能够在较短的时间内完成大量实验,并从数据中提取有价值的科学信息。

此外,研究团队还强调了实验数据的开放性和可访问性。所有实验相关的代码和数据均被公开在 GitHub 上,便于其他研究人员进行复现和进一步开发。同时,他们还提供了实验数据的 DOI 链接,使得数据能够被更广泛地引用和使用。这种开放共享的策略不仅促进了科学研究的透明度,也为未来的材料发现研究提供了宝贵的资源。

总体而言,这项研究为材料科学中的路径依赖性实验设计提供了一种全新的方法。通过引入 iEIG 获取函数和基于云的自动化平台,研究人员能够在更短时间内获取更精确的材料性能数据,从而加速材料的发现和优化过程。这种方法不仅适用于电化学稳定性评估,还可以推广到其他涉及路径依赖性的材料研究领域,如催化材料的性能测试、电池材料的寿命评估等。未来,随着 AI 技术的不断发展和实验自动化水平的提高,iEIG 方法有望在更多复杂的材料研究中发挥重要作用,推动材料科学的进一步创新。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号