
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习预测稀有及过渡金属配合物核磁共振化学位移:基于45Sc、49Ti、89Y、91Zr和139La的高效计算框架
【字体: 大 中 小 】 时间:2025年08月30日 来源:Journal of Molecular Liquids 5.2
编辑推荐:
(编辑推荐)本研究开创性地采用机器学习(ML)技术,以RDKit二维分子描述符构建CatBoost模型,实现了对45Sc、49Ti等5种金属核磁共振(NMR)化学位移的高效预测(平均误差7-13%)。通过SHAP分析揭示环状结构和静电相互作用是关键影响因素,为催化材料设计和分子诊断(如89Y超极化MRI)提供了资源节约型解决方案。
亮点
本研究通过机器学习方法系统评估了稀有及过渡金属(45Sc、49Ti、89Y、91Zr、139La)核磁共振化学位移的预测策略。特别值得注意的是,针对钪/钇/镧的联合模型保持优异性能,而钛/锆数据合并会因电子环境差异导致预测精度下降——这一发现为金属特异性建模提供了重要指导。
数据集
研究团队系统收集了1976-2023年间液态NMR数据,建立包含499个实验测量值的数据库(化学位移范围-1389至1325 ppm)。每个数据点均包含化合物SMILES编码、溶剂类型和测量温度等元数据,并通过RDKit生成2D分子描述符。
个体模型开发
采用5折交叉验证比较五种ML算法,CatBoost模型表现最优:对Sc/Y/La组合的均方根误差(RMSE)为123.7 ppm(约7%),钛/锆化合物误差分别为240.4 ppm(9%)和165.2 ppm(13%)。关键发现包括:
环状结构会显著影响45Sc的位移
溶剂效应可忽略不计
静电描述符对139La预测贡献度达22%
结论
这项工作建立了首个涵盖5种关键金属的NMR预测通用框架,其重要意义体现在:
• 突破传统密度泛函理论(DFT)在重元素计算中的资源瓶颈
• 为89Y分子探针开发提供快速筛选工具
• 揭示钛/锆配合物电子结构的本质差异
作者贡献声明
Yaroslav I. Isaev:主导算法开发与数据可视化
Dmitry M. Makarov:负责项目设计与方法论构建
Ilya A. Khodov:提出核心研究概念与数据分析
(翻译说明:采用"液态NMR""均方根误差"等专业表述,保留89Y等同位素标注;使用"资源瓶颈""快速筛选工具"等生动表达;关键数据以项目符号突出显示)
生物通微信公众号
知名企业招聘