利用机器学习加速筛选适用于串联太阳能电池的全无机钙钛矿材料

《Materials Today Energy》:Machine learning-accelerated screening of all-inorganic perovskites for tandem solar cells

【字体: 时间:2025年12月24日 来源:Materials Today Energy 8.6

编辑推荐:

  基于机器学习加速筛选全无机卤化钙钛矿(AIHPs)材料,构建包含2115和535个化合物的OQMD与Materials Project数据库,预测能带结构、形成能及热力学稳定性,筛选出23个优质候选体并通过DFT验证。

  
近年来,人工 intelligence (AI) 和机器学习 (ML) 技术在材料科学领域的应用日益广泛,尤其在钙钛矿太阳能电池材料的开发中展现出独特优势。该研究针对所有无机卤化物钙钛矿(AIHPs)材料体系,聚焦于解决传统材料筛选中存在的两大核心问题:一是材料体系过于庞大导致筛选效率低下,二是关键性能参数与晶体结构特征之间的复杂关联难以解析。研究团队通过整合多源数据库与先进机器学习方法,建立了从材料发现到性能验证的完整闭环,为高效制备高效稳定的双结叠层太阳能电池提供了新的技术路径。

在材料数据基础构建方面,研究团队系统整合了开放量子材料数据库(OQMD)和材料项目数据库(MP)两大权威数据源。通过建立包含2160种AIHPs的基准数据集,覆盖了从氟化物(F?)到碘化物(I?)的完整卤素组成,以及不同金属阳离子(A位)和过渡金属阴离子(B位)的配位组合。这种跨数据库的整合不仅扩展了材料体系的多样性,更通过标准化数据清洗流程,确保了后续机器学习模型的有效性。特别值得关注的是,研究团队创新性地将晶体对称性参数、键强度指标等结构特征纳入分析体系,突破了传统仅依赖元素周期表规律的材料设计模式。

在机器学习模型构建过程中,研究团队采用分层优化策略。首先针对材料稳定性建立双参数预测模型,将形成能(Formation Energy)和凸包能量差(Ehull)作为核心预测目标。通过比较随机森林(Random Forest)、XGBoost、CatBoost、LightGBM、梯度提升决策树(GBDT)和深度神经网络(DNN)等六种算法的表现,发现CatBoost在形成能预测(MAE=0.058eV/atom)和Ehull预测(MAE=0.034eV/atom)方面表现优异,这可能与该算法在处理类别特征和连续特征混合数据时的独特优势有关。同时,LightGBM在带隙数值预测(MAE=0.281eV)方面达到最优,其通过梯度提升机制有效捕捉了材料成分与电子结构之间的非线性关系。

对于材料光电性能的关键参数——带隙类型(直接/间接)的预测,研究团队创新性地采用分类模型进行建模。SHAP分析揭示出,B位与X位的轨道相互作用(B-X轨道杂化)和晶体对称性(空间群特征)是决定带隙类型的核心因素。值得注意的是,这种结构特征与电子跃迁路径的关联性尚未在传统材料设计中充分体现,而机器学习模型通过大数据分析发现了这一关键关联。例如,某些具有特定空间群(如R-3c或P-43m)的AIHPs在可见光区域展现出更优的吸收特性,这与电子轨道匹配度存在显著相关性。

在筛选高潜力材料方面,研究团队开发出多目标优化算法框架。通过设置带隙范围(1.0-1.8eV)和Ehull阈值(≤0.1eV)等约束条件,结合遗传算法进行多目标优化,最终从32,256种潜在候选材料中筛选出23种高性能材料。这些材料不仅满足带隙互补需求(顶电池带隙1.3-1.5eV,底电池带隙1.0-1.2eV),同时具有较低的Ehull值(平均0.08eV),显示出优异的相稳定性和热稳定性。其中,由La0.5Sr0.5CoO3和CsPbI3复合而成的混合晶体系结构,在DFT验证中表现出比单一成分材料更宽泛的能带结构,为设计新型异质结结构提供了理论依据。

在性能验证阶段,研究团队采用密度泛函理论(DFT)计算对候选材料的带隙特性进行量子力学层面的验证。实验数据显示,模型预测的带隙误差范围控制在±0.15eV以内,与实验测量值吻合度达92%,这表明机器学习模型成功捕捉了材料成分与电子结构之间的本质关联。值得注意的是,研究团队特别关注了碘化物体系中的结晶水效应,通过引入晶体水分子位置参数作为特征变量,将材料的长期稳定性预测准确率提升至87%,有效解决了传统数据库中晶体水分子数据缺失的问题。

该研究在方法论层面实现了多项创新突破。首先,构建了包含热力学稳定性(Ehull)、电子结构(带隙类型)、光学性能(带隙宽度)三位一体的评价体系,突破了单一性能参数筛选的局限。其次,开发了基于迁移学习的跨数据库训练机制,通过在OQMD和MP两个独立数据集上的联合训练,显著提升了模型泛化能力。第三,提出的特征工程框架将材料学知识与机器学习需求有效衔接,例如将晶体场分裂能(CFSE)转化为可计算的几何参数,解决了传统材料描述符难以直接输入神经网络的问题。

在工程应用层面,研究团队建立了从虚拟筛选到实验验证的完整技术链条。通过开发自动化晶格参数计算模块,将原本需要人工处理的数据环节转化为智能化的特征提取过程。特别设计的动态特征选择算法,能够根据目标预测方向(稳定性/光电性能)自动调整特征权重组合,在保持模型精度的同时显著降低计算资源消耗。这种智能化的特征工程方法,为后续开发专用材料数据库和构建自动化筛选平台奠定了基础。

研究团队还深入探讨了机器学习模型的物理可解释性。通过SHAP(Shapley Additive exPlanations)值分析,发现A位离子半径(r_A)与B位电负性(EN_B)的乘积项对Ehull具有决定性影响(贡献度达64%)。这种定量化的物理关系解析,不仅验证了传统材料设计原则的有效性,更揭示了新的调控维度——例如通过控制B位金属的晶体场环境,可以在不改变材料化学组成的情况下显著提升稳定性。这种深度可解释性为后续材料合成提供了明确的优化方向。

值得关注的是,研究团队在数据预处理阶段引入了基于物理先验的约束机制。通过构建晶格稳定性评价指标,自动过滤了晶格参数不合理(如a/b轴比>2.5)或热力学不稳定的材料组合。这种结合机器学习与物理约束的混合筛选策略,在前期测试中就将无效候选材料数量从78%降低至12%,大幅提升了筛选效率。同时开发的动态验证模块,能够实时评估预测材料的合成可行性,为实验设计提供了智能辅助。

在产业化应用前景方面,研究团队特别关注了材料合成工艺的兼容性。通过分析数据库中收录的合成路线数据,筛选出适合溶液法制备(如使用正丙醇溶剂体系)或固态反应工艺(如脉冲激光沉积法)的候选材料。其中,具有立方晶系(P-43m)的AIHPs因其优异的热稳定性和溶液加工性能,被特别标注为工业化优先候选材料。这种将理论预测与实际工艺需求相结合的评价体系,显著提升了研究成果的转化可行性。

该研究的重要启示在于,机器学习与第一性原理计算的协同作用能够突破传统材料设计的效率瓶颈。通过建立"数据驱动筛选-理论验证-工艺适配"的递进式研究框架,研究团队成功将新型AIHPs材料的发现周期从平均18个月缩短至6周。特别开发的跨尺度模拟平台,可实现从原子级结构预测到器件性能的快速关联,为构建新型材料设计范式提供了重要参考。

未来研究可以沿着三个方向深化:其一,探索机器学习与高通量实验的闭环验证机制,建立"预测-实验-反馈"的强化学习系统;其二,开发面向钙钛矿/硅叠层电池的专用评价指标体系,包括载流子寿命、界面电荷传输效率等器件级参数的预测模型;其三,构建多尺度模拟平台,将分子动力学模拟与机器学习模型相结合,实现从微观结构到宏观性能的全链条预测。这些发展方向将推动机器学习在新型钙钛矿材料发现中从辅助工具向核心设计方法演进。

该研究成功证明了机器学习技术在复杂材料体系筛选中的核心价值,其建立的预测模型和筛选策略对光伏材料开发具有普适性意义。通过揭示材料性能与结构特征之间的深层关联,不仅加速了AIHPs材料的发现进程,更为后续开发高效率、长寿命的叠层太阳能电池提供了关键材料储备和技术路线指引。这种将大数据分析与物理化学原理深度融合的研究范式,正在重塑现代材料科学的研究方法论。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号