
-
生物通官微
陪你抓住生命科技
跳动的脉搏
单原子合金催化剂机器学习与DFT数据库:甲烷分解中C-H键解离能垒的精准预测与高效氢能开发
【字体: 大 中 小 】 时间:2025年04月18日 来源:Scientific Data 5.8
编辑推荐:
本期推荐:研究者针对传统甲烷分解工艺存在高能耗、低选择性问题,通过机器学习(ML)与密度泛函理论(DFT)构建包含10,950组数据的单原子合金(SAA)催化剂数据库,预测C-H解离能垒(ΔE),发现Fe/Co/Ni基催化剂活性最佳(MAE=0.094 eV),为无CO2排放的制氢技术提供精准设计工具。
在能源转型与碳中和的全球背景下,绿色氢能被视为破解能源与环境困局的"终极方案"。甲烷热分解制氢因其理论产物纯净(仅产生H2和固态碳)而备受关注,但传统镍基催化剂面临活性位点不均、积碳失活等挑战。更棘手的是,现有催化数据库多聚焦热力学参数(如吸附能),而决定反应速率的动力学参数——特别是C-H键解离能垒——的系统性数据严重匮乏。单原子合金(Single-Atom Alloy, SAA)催化剂因其原子级分散的活性位点和可调控的电子结构,在甲烷活化中展现出独特优势,但传统"试错法"筛选效率低下,亟需建立理论指导下的高效设计范式。
苏州大学功能纳米与软物质研究院、山东大学前沿化学研究院的研究团队在《Scientific Data》发表突破性研究,通过融合第一性原理计算与机器学习技术,构建了目前最全面的SAA催化剂C-H解离能垒数据库。研究采用维也纳从头算模拟软件包(VASP)完成689组DFT计算,通过投影缀加波(PAW)方法和PBE泛函处理电子交换关联作用,结合Grimme's DFT-D3修正范德华力,采用爬坡弹性带(CI-NEB)方法精确捕捉过渡态。基于623组训练数据,团队开发出预测精度达r2=0.921的梯度提升决策树(GBDT)模型,最终数据库涵盖30种过渡金属组成的10,950种SAA体系能垒数据。
关键技术创新体现在三方面:首先,研究首创"元素属性-表面配位-复合描述符"三级特征工程体系,从材料项目(MP)数据库提取85维初始特征,通过皮尔逊相关系数(p<0.8)和互信息回归(MIC)筛选出核心描述符。其中掺杂金属加权表面能(doped_weighted_surface_energy)贡献超40%重要性,揭示电子得失能力对催化活性的主导作用。其次,采用超胞扩展确保表面模型厚度>5?,通过PyMatgen自动识别顶位(top)、桥位等活性位点,建立多标签分类模型(ETC+KNC组合)预测反应位点分布。最后,通过1000次交叉验证确认GBDT模型在测试集上RMSE仅0.130 eV,显著优于随机森林等15种对比算法。
数据验证展现卓越可靠性:与独立DFT测试集比对显示r2=0.881,典型体系如Ir/Ir(111)预测值1.17 eV与实验值1.21 eV高度吻合。数据库揭示三大规律:①Fe/Co/Ni基底表现出最高活性,与文献报道的d带中心调控机制一致;②顶位吸附占主导(8,638组数据),配位数CN-B3+1-top05是关键几何描述符;③Os/Ir/Ru等掺杂原子能显著降低能垒,为"单原子-基底"协同效应提供量化证据。特别值得注意的是,相比传统Cu(111)表面(ΔE=2.21 eV),优化后的Co@Ni体系预测值仅0.87 eV,降幅达60%。
这项研究实现了从"经验探索"到"数据驱动"的催化研究范式转变。公开的数据库包含三大模块:①DFT原始结构文件(Figshare存储);②包含基底空间群、表面比例等5类基础属性(F)的CSV数据集;③85维机器学习描述符(D1-D3类)与预测结果(O)。所有数据遵循CC BY-NC-ND 4.0协议开放获取,配套的PyMatgen脚本已上传Zenodo平台。该成果不仅为甲烷无氧制氢催化剂设计建立新标准,其"DFT校准+ML扩展"的研究框架更可推广至CO2还原、氨合成等复杂催化体系,加速清洁能源材料的数字化开发进程。
在讨论部分,研究者强调该数据库填补了催化动力学参数的空白,其预测结果与实验观测的活性趋势高度一致(如Ni(111)基底1.28 eV vs 文献值1.36 eV)。未来工作将拓展至C-C键活化、抗积碳稳定性等维度,并探索与高通量实验的闭环验证。这项由李佑永、邓伟桥团队主导的研究,通过国家重点研发计划等基金支持,彰显我国在计算催化领域的国际竞争力,为《自然》期刊提出的"氢能革命"提供了切实可行的材料解决方案。
生物通微信公众号
知名企业招聘