基于Wasserstein生成对抗网络与梯度惩罚-内容约束的氧氮玻璃数据增强机器学习模型研究

【字体: 时间:2025年08月11日 来源:Journal of Materiomics 9.6

编辑推荐:

  针对氧氮玻璃(oxynitride glasses)小数据集导致的机器学习模型性能受限问题,研究人员开发了基于Wasserstein生成对抗网络(WGAN-GP-CP)的数据增强方法,结合XGBoost算法构建了性能优异的成分-性能预测模型,并通过SHAP分析揭示了元素交互作用机制,为高性能氧氮玻璃设计提供了新策略。

  

在材料科学领域,氧氮玻璃(oxynitride glasses)因其优异的机械性能和化学稳定性备受关注。这类材料最初作为氮化硅陶瓷的晶界相被发现,其结构中氮(N)部分取代氧(O)形成更刚性的网络结构,具有更高的弹性模量(E)、维氏硬度(Hv)和玻璃转变温度(Tg),同时表现出更低的热膨胀系数(CTE)。然而,氧氮玻璃的制备工艺复杂,需要在1650°C以上的高温熔融并严格控制氧分压,这导致实验数据获取困难,相关研究长期受限于小样本数据集。传统试错法开发新玻璃成分效率低下,而现有的通用机器学习模型如GlassNet对氧氮玻璃这类特殊体系的预测精度不足。

针对这一挑战,浙江大学材料科学与工程学院的研究团队创新性地将数据增强技术引入氧氮玻璃研究。他们开发了基于Wasserstein生成对抗网络(WGAN-GP)的新型数据增强方法,通过添加梯度惩罚(GP)和内容约束惩罚(CP)项,构建了WGAN-GP-CP模型。该模型能生成物理合理的合成样本,有效扩充了氧氮玻璃的小型数据集。基于增强后的数据集,研究人员采用XGBoost算法训练了针对Hv、E、CTE、折射率(nv)、Tg和密度(ρ)六个关键性能的预测模型,并通过SHAP分析揭示了元素间的交互作用机制。相关研究成果发表在《Journal of Materiomics》上。

研究采用了三项关键技术方法:首先从SciGlass数据库收集氧氮玻璃数据并进行严格清洗,构建六个性能数据集;其次开发WGAN-GP-CP模型进行数据增强,该模型在标准WGAN-GP基础上添加内容约束项确保生成样本的物理合理性;最后采用XGBoost算法构建预测模型,并应用SHAP方法进行模型可解释性分析。

研究结果部分,数据可视化分析显示氧氮玻璃的性能分布明显区别于普通氧化物玻璃,具有更高的Hv(8-10GPa)和E(90-160GPa)等特征。模型训练结果表明,数据增强显著改善了模型性能,XGB_A模型在测试集上的R2值比XGB_R模型平均提高5.3%,MAE降低15.6%。特别值得注意的是,在101个未见实验样本上的测试中,XGB_A模型的预测精度优于通用模型GlassNet,如对Hv的MAE从0.7729降至0.5372。

SHAP分析揭示了元素对性能的影响规律:N对Hv、E、Tg和ρ有正向贡献,对CTE呈负向影响;同时发现了N与其他元素的交互作用,如N-Ca对Hv、N-Al对E的显著影响。这些发现与核磁共振研究揭示的N增加网络交联度的机制相符,同时发现了Al在氧氮玻璃中对nv的正向贡献等新现象。

该研究通过创新的数据增强方法有效解决了氧氮玻璃研究中的小数据难题,建立的预测模型精度显著优于现有通用模型。SHAP分析不仅验证了已知的N作用机制,还揭示了元素在氧氮玻璃中可能表现出的新行为,为设计高性能氧氮玻璃提供了理论依据和新思路。这项工作展示的数据增强策略对解决材料科学中其他小数据集问题也具有重要参考价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号