基于规则提取的Inter-Hammett框架:提升汉默特常数预测可解释性的新方法

【字体: 时间:2025年08月06日 来源:ChemistrySelect 2

编辑推荐:

  针对汉默特常数(σm, σp, σc)实验测定耗时且现有图神经网络(GNNs)可解释性差的问题,研究人员开发了集成多源化学信息学描述符与RuleFit建模的Inter-Hammett框架。该模型通过AutoGluon特征选择实现R2达0.880的高精度预测,并提取可解释决策规则,为芳香族化合物取代基效应研究提供透明化分析工具。

  

这项研究突破性地构建了Inter-Hammett预测框架,巧妙融合了RDKit、Mordred、CDK和PyBioMed四大化学信息学工具包生成的分子描述符。面对传统汉默特常数(Hammett constants)测定需要复杂实验的困境,以及当前图神经网络(GNN)模型如同"黑箱"的缺陷,研究团队另辟蹊径采用RuleFit算法——这种创新方法既能保持0.128的超低RMSE预测精度,又能像化学家的思维笔记般输出"若芳香环连接硝基且距离羧基3个键位,则σp值增加0.5"这类直观规则。

通过AutoGluon智能筛选的127个关键分子特征,系统成功解码了取代基电子效应的"分子密码":从简单的偶极矩到复杂的拓扑电荷指数,每个入选描述符都通过SHAP值分析获得量化解释。特别值得注意的是,模型在预测间位(σm)和对位(σp)常数时,其准确性甚至超越了最新发表的四种深度学习模型,而决策树生成的"如果分子量>180且氢键供体<2,则归类为强吸电子基团"等规则,让化学工作者能像查阅反应手册般理解预测依据。

这项技术突破犹如为物理有机化学研究装上了"X光透视镜",不仅将传统需数周完成的取代基效应评估缩短至秒级,更通过局部依赖关系图(LIME)等七种可解释性分析方法,首次实现了汉默特常数的"白盒化"预测。当苯环上的氯原子被甲氧基取代时,系统能清晰展示π电子云密度变化如何通过共振效应影响σp值——这种直观的机制阐释,为合理设计药物分子和功能材料提供了前所未有的理论指导。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号