PredPotS:基于深度学习的有机分子单电子标准还原电位预测网络工具及其在电化学中的应用

《npj Computational Materials》:PredPotS: web tool for predicting one-electron standard reduction potentials for organic molecules in aqueous phase

【字体: 时间:2025年12月08日 来源:npj Computational Materials 11.9

编辑推荐:

  本研究针对有机氧化还原材料设计中还原电位(E°)预测成本高、效率低的问题,开发了基于深度学习的网络工具PredPotS。研究人员通过GFN2-xTB/M06-2X复合计算协议构建了包含8033个有机分子的RP-ChEMBL数据库,并利用五种图神经网络模型(Attentive FP、Graph Conv、GCN、GAT、DAG)实现了对单电子标准还原电位的高效预测。该工具通过SMILES代码输入即可在秒级内获得与实验值吻合良好的预测结果(MAE=0.14-0.19 V),为水性有机液流电池(AO-RFBs)等电化学应用的快速筛选提供了可靠平台。

  
在能源转型的大背景下,水性有机液流电池(Aqueous Organic Redox Flow Batteries, AO-RFBs)因其安全性高、规模可扩展等优势,成为大规模储能领域的研究热点。然而,寻找具有合适还原电位的有机氧化还原活性材料仍面临巨大挑战——传统实验测量方法受质子化过程、不可逆反应等因素干扰,而密度泛函理论(Density Functional Theory, DFT)计算虽精度较高却耗时耗力。这种"效率-精度"的矛盾严重制约了新材料的开发进程。
为解决这一瓶颈问题,来自匈牙利科学院有机化学研究所的Flora B. Németh等研究人员在《npj Computational Materials》上发表了题为"PredPotS: web tool for predicting one-electron standard reduction potentials for organic molecules in aqueous phase"的研究论文。他们开发了一款名为PredPotS的在线预测工具,通过融合量子化学计算与深度学习技术,实现了对有机分子单电子标准还原电位的高通量、快速预测。
研究人员采用的关键技术方法包括:1)基于ChEMBL分子库构建RP-ChEMBL数据库(8033个分子,MW<200 g/mol);2)建立GFN2-xTB/M06-2X复合计算协议生成训练数据;3)利用DeepChem框架训练五种图神经网络模型(Attentive FP、Graph Conv、GCN、GAT、DAG);4)通过SMILES代码标准化和分子指纹相似性分析实现网络工具部署。
分子数据库RP-ChEMBL
研究团队从ChEMBL生物活性分子库中筛选出分子量小于200 g/mol的有机化合物,通过最大最小化算法和球面排除算法最终选定8033个具有高化学多样性的分子。这些分子包含C、N、O、F、P、S、Cl、Br等重原子,其计算还原电位分布范围在-4.3至+0.8 V(相对于标准氢电极SHE)。值得注意的是,与水性电解质电化学稳定性窗口相对应的电位区间(-1 V至更正值)虽然样本较少,但仍得到充分覆盖。
DeepChem模型及其性能
研究采用DeepChem框架中的五种图神经网络架构进行训练,所有模型均表现出优异的预测性能。其中Attentive FP模型表现最为突出,在测试集上的平均绝对误差(MAE)为0.14 V,均方根误差(RMSE)为0.20 V,决定系数(R2)达到0.94。误差分析表明,84.1%的测试集分子预测误差在±0.25 V范围内,这一不确定性水平与GFN2-xTB/M06-2X计算协议本身的不确定性相当。
PredPotS网络工具
基于训练好的深度学习模型,研究团队开发了交互式网络应用程序PredPotS(访问地址:https://predpots.ttk.hu/)。用户只需输入或上传分子的SMILES代码,即可在几秒内获得五种模型的预测结果。工具还提供相似性搜索功能,可识别与输入分子结构最相似的数据库分子,并显示其还原电位和Tanimoto相似系数。
示例验证
为验证工具实用性,研究人员选取了四种吡啶鎓衍生物(包括苯甲酰吡啶鎓盐和甲基紫精等典型AO-RFBs电解质)进行测试。预测结果与实验值对比显示,PredPotS能够提供合理的电位估计,特别是对于分子量较小的化合物预测精度更高。
Wardman汇编化合物的预测
研究人员进一步使用Wardman汇编的313个实验还原电位数据验证工具性能。对于分子量小于200的化合物子集,预测值与实验值的平均绝对误差为0.13 V,决定系数为0.75,表明工具具有良好的外推能力。值得注意的是,对于分子量200-300 g/mol的较大分子,预测不确定性有所增加,但仍有74.9%的分子预测误差在±0.25 V范围内。
300 g/mol.'>
讨论与结论
本研究成功开发了基于深度学习的有机分子还原电位预测平台PredPotS,该工具将预测时间从量子化学计算的小时级缩短至秒级,同时保持了可接受的精度水平。虽然当前版本主要针对分子量小于200 g/mol的化合物优化,但对更大分子的测试表明其具有一定的外推能力。研究人员指出,未来通过扩展训练数据库和引入全DFT计算方法,可进一步提升预测精度和适用范围。
PredPotS的推出为电化学材料设计提供了强有力的筛选工具,特别适用于水性有机液流电池、光氧化还原催化、电化学传感等领域的快速材料发现。这种将量子化学计算与机器学习相结合的研究范式,为复杂材料性质的预测开辟了新途径,有望加速可持续能源存储材料的设计与开发进程。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号