机器学习预测稀有及过渡金属配合物核磁共振化学位移:基于45Sc、49Ti、89Y、91Zr和139La的高效计算框架

【字体: 时间:2025年08月30日 来源:Journal of Molecular Liquids 5.2

编辑推荐:

  (编辑推荐)本研究开创性地采用机器学习(ML)技术,以RDKit二维分子描述符构建CatBoost模型,实现了对45Sc、49Ti等5种金属核磁共振(NMR)化学位移的高效预测(平均误差7-13%)。通过SHAP分析揭示环状结构和静电相互作用是关键影响因素,为催化材料设计和分子诊断(如89Y超极化MRI)提供了资源节约型解决方案。

  

亮点

本研究通过机器学习方法系统评估了稀有及过渡金属(45Sc、49Ti、89Y、91Zr、139La)核磁共振化学位移的预测策略。特别值得注意的是,针对钪/钇/镧的联合模型保持优异性能,而钛/锆数据合并会因电子环境差异导致预测精度下降——这一发现为金属特异性建模提供了重要指导。

数据集

研究团队系统收集了1976-2023年间液态NMR数据,建立包含499个实验测量值的数据库(化学位移范围-1389至1325 ppm)。每个数据点均包含化合物SMILES编码、溶剂类型和测量温度等元数据,并通过RDKit生成2D分子描述符。

个体模型开发

采用5折交叉验证比较五种ML算法,CatBoost模型表现最优:对Sc/Y/La组合的均方根误差(RMSE)为123.7 ppm(约7%),钛/锆化合物误差分别为240.4 ppm(9%)和165.2 ppm(13%)。关键发现包括:

  1. 1.

    环状结构会显著影响45Sc的位移

  2. 2.

    溶剂效应可忽略不计

  3. 3.

    静电描述符对139La预测贡献度达22%

结论

这项工作建立了首个涵盖5种关键金属的NMR预测通用框架,其重要意义体现在:

• 突破传统密度泛函理论(DFT)在重元素计算中的资源瓶颈

• 为89Y分子探针开发提供快速筛选工具

• 揭示钛/锆配合物电子结构的本质差异

作者贡献声明

Yaroslav I. Isaev:主导算法开发与数据可视化

Dmitry M. Makarov:负责项目设计与方法论构建

Ilya A. Khodov:提出核心研究概念与数据分析

(翻译说明:采用"液态NMR""均方根误差"等专业表述,保留89Y等同位素标注;使用"资源瓶颈""快速筛选工具"等生动表达;关键数据以项目符号突出显示)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号