实空间机器学习关联密度泛函:提升密度泛函近似迁移性的新策略

《Nature Communications》:Real-space machine learning of correlation density functionals

【字体: 时间:2025年12月02日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对机器学习密度泛函近似(DFA)迁移性不足的核心问题,提出了实空间能量密度学习策略。通过开发κ-正则化MP2关联能量密度生成器,研究人员构建了ML2和MLS2两种机器学习模型,成功实现了从小原子训练集到双原子分子解离曲线的准确迁移,为克服传统DFA在化学空间泛化能力差的瓶颈提供了创新解决方案。

  
在量子化学和材料科学领域,密度泛函理论(DFT)已成为最重要的计算工具之一。然而,传统人类设计的密度泛函近似(DFA)存在严重的迁移性限制——即在未知化学系统上的泛化能力不足。随着机器学习(ML)技术在科学计算中的广泛应用,研究人员开始探索利用ML来改进DFA,但现有的ML-DFA方法仍然无法解决迁移性这一根本问题。
以DeepMind开发的DM21泛函为例,尽管在训练集上表现出色,但在某些过渡金属原子计算中出现了灾难性的迁移失败,甚至无法收敛。这一现象凸显了当前ML-DFA方法的局限性,使得有机化学家在研究过渡金属催化反应机理时,仍然更倾向于使用传统的"老派"DFA,如B3LYP或PBE。
问题的核心在于数据效率不足。传统的全局能量损失(GES)方法将每个系统的单个能量作为一个数据点进行学习,这种"一系统一数据"的方式无法充分利用化学空间的信息。相比之下,力场学习中的力(能量梯度)比能量本身包含更多信息,类似地,电子密度学习也将每个格点作为数据点,显著提高了迁移性。
瑞士弗里堡大学的研究团队在《Nature Communications》上发表的这项研究,提出了一种创新的解决方案——实空间机器学习关联密度泛函。研究团队通过两个关键突破来构建高迁移性的DFA:首先是引入了局部能量损失(LES)策略,将每个系统的单一能量扩展为数千个空间数据点;其次是开发了基于M?ller-Plesset绝热连接(MPAC)框架的κ-正则化二阶微扰理论(κMP2)关联能量密度生成器。
研究团队采用的主要技术方法包括:κ-正则化MP2关联能量密度生成器的开发与实现,基于神经网络的实空间机器学习模型构建,局部能量损失(LES)与全局能量损失(GES)的对比验证,以及自旋分量的实空间缩放技术。所有计算均使用PySCF程序包,结合def2-QZVP(P)基组和密度拟合近似,神经网络训练采用PyTorch库实现。
局部与全局能量损失的对比
研究团队首先明确了LES与GES的本质区别。LES通过惩罚空间不同区域能量贡献之间的误差抵消,显著增强了ML-DFA的迁移性。具体而言,GES仅关注总能量差异,而LES则考虑参考能量密度与ML能量密度之间的点对点差异,加权以电子密度。
正则化PT2关联能量密度每粒子的改进与推导
为了解决MP2关联能量密度在描述化学键解离时的发散问题,研究团队引入了Head-Gordon的κ-正则化方法。通过正则化MP2双激发振幅,得到的ecκMP2(r)在保持MP2精度的同时,消除了小轨道能隙系统的发散行为。κ值设置为2.0,以在平衡键长和拉伸键长之间取得最佳平衡。
正则化PT2关联能量密度用于相互作用能量
通过分析氦二聚体的自旋分辨相互作用关联能量密度,研究团队展示了ΔP2κMP2(r,r′)如何编码弱相互作用的物理本质,特别是色散效应。这种基于静电势的规范选择为描述片段间相互作用提供了物理上可解释的局部关联能量量。
通过机器学习正则化ecκMP2(r)构建ML2模型
ML2模型通过神经网络将一组点特征映射到权重wc(r),关键特征包括Grimme的电子温度依赖分数占据数加权密度(FOD),该特征能有效区分分子中的强关联和弱关联区域。ML2模型保持了κMP2关联能量密度的尺度不变性,这是通过精心设计的函数形式实现的。
局部能量损失学习过程的优势
研究表明,基于LES的ML2模型仅使用8个小闭壳层原子/离子训练,就能准确预测BH和LiH等双原子分子的解离曲线。学习过程显示,随着训练周期增加,氦原子的点对点能量密度误差改善直接转化为对未见系统LiH相关能量的改进预测,而GES模型即使在大量训练周期后仍无法实现有效迁移。
基于LES的ML2模型的唯一性与鲁棒性
通过系统测试不同规范变换、损失函数定义和神经网络架构,研究团队证实了LES-based ML2模型的优越性能并非仅源于数据效率,而是与物理约束的紧密集成密切相关。模型对随机初始化种子和神经网络结构的变化表现出显著鲁棒性。
自旋分辨与正则化关联能量密度建模
MLS2模型通过局部缩放κMP2的自旋分量能量密度,构建了从κMP2到真实关联能量的桥梁。该模型在W4-11测试集上将平均绝对相对误差从MP2的约10%降低至1%,在BH解离曲线和甲酸二聚体相互作用能预测中均表现出色。
研究结论与意义
这项研究通过实空间能量学习策略,为解决ML-DFA的迁移性问题提供了创新解决方案。ML2模型证明了LES在提高数据效率和迁移性方面的巨大潜力,而MLS2模型则展示了如何将正则化微扰理论与机器学习相结合,开发出既准确又具有良好迁移性的密度泛函近似。
该研究的重要意义在于:首先,确立了实空间能量密度学习作为提升ML-DFA迁移性的有效途径;其次,开发了κ-正则化MP2关联能量密度生成器,为高质量训练数据提供了可靠来源;最后,通过MLS2模型实现了对传统DFA自相互作用误差的有效缓解,为处理强关联系统提供了新思路。
未来研究方向包括开发更高级别的能量密度生成器,以及将LES策略与密度学习相结合,进一步推动ML-DFA的发展。这项研究为量子化学计算方法的发展开辟了新途径,有望在材料设计和药物发现等领域产生深远影响。
c(r) (total correlation energy density minus the one from the individual subsystems).(a):second-order M?ller-Plesset perturbation theory(MP2) plot along the inter-nuclear axis of the helium dimer(position of the nuclei are denoted by the spheres) at an interatomic distance of 5.6 a.u.. Inset shows the corresponding interaction pair density ΔP2MP2(r,r′) at r=zo on the same axis.(b): MP2 volume slice plots for the benzene-CH4 complex89 along planes perpendicular and parallel to the benzene ring. Binding and non-binding regions are highlighted by negative(red) and positive(blue) Δēc(r) volumes.(c): Isosurface visualization of MP2(rough mesh) and its κ-regularization(κMP2) with κ=1.4 (solid surface) for the same complex at binding isovalue(-2.5e-5(a.u.)).(d): same as(c), but for the ss part.">
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号