通过基于不良结局途径(Adverse Outcome Pathway)的机器学习,将AhR和Nrf2的激活与神经毒性联系起来

《Toxicology》:Linking AhR and Nrf2 Activation to Neurotoxicity through Adverse Outcome Pathway-based Machine Learning

【字体: 时间:2025年12月12日 来源:Toxicology 4.6

编辑推荐:

  化学诱导神经毒性评估面临复杂机制和传统方法的局限性。本研究开发基于adverse outcome pathway(AOP)的机器学习框架,整合AhR/Nrf2通路激活数据与分子结构特征(如含氮基团),构建高生物可解释性的预测模型(AUC>0.80)。通过虚拟筛选7576化合物并考虑血脑屏障穿透性,结合12种持久性有机污染物(POPs)的分子对接分析(AhR结合能-10.2 kcal/mol,Nrf2-9.1 kcal/mol),验证了该机制驱动方法在神经毒性预测和风险优先级排序中的有效性。

  
本研究针对化学物质诱导神经毒性评估的挑战,提出了一种基于不良后果路径(Adverse Outcome Pathway, AOP)的机制导向机器学习框架。该框架通过整合分子结构特征与关键生物信号通路,实现了对神经毒性潜在风险的高效预测与科学解释。

传统神经毒性评估依赖动物实验,存在周期长、成本高、伦理受限等问题。尽管计算模型在QSAR(定量结构-活性关系)领域取得进展,但现有研究多局限于结构特征分析,缺乏对毒性机制的系统解析。本研究创新性地引入AOP框架,构建了包含"分子启动事件-关键生物学事件-毒性表现"的三级预测体系,为机制驱动的毒性评估提供了新范式。

数据构建方面,研究团队系统整合了四类关键数据源:
1. **在体神经毒性数据集**:包含2,799种化合物,其中1,856种被证实具有神经毒性(阳性样本),943种无毒性(阴性样本)。数据来源涵盖环境污染物、药物中间体及食品添加剂,覆盖不同毒性作用模式。
2. **AhR通路数据库**:收录333,866种化合物,其中9,053种显示AhR受体激活活性。该数据库特别标注了化学物质与AhR配体结合域的相互作用特征。
3. **Nrf2通路数据库**:包含9,800种化合物,1,540种具有Nrf2信号激活能力。重点关注KEAP1/Nrf2复合物的配体结合模式。
4. **血脑屏障穿透性数据库**:筛选出9,505种化合物,其中5,642种具有高渗透性。该数据为评估神经毒性发挥条件提供了重要约束。

特征工程阶段,研究团队采用双轨特征编码策略:
- **结构特征**:通过扩展连接指纹(ECFP)提取分子拓扑学特征,特别关注含氮杂环、芳香酮等具有神经毒性结构警示的基团。
- **通路特征**:整合AhR(Zinc指蛋白结构域)和Nrf2(Cullin3结构域)的活性预测值,采用标准化处理消除量纲差异。

模型构建采用分层集成策略:
1. 基础QSAR模型:以ECFP指纹为核心,引入随机森林算法,验证集AUC达0.82
2. AOP增强模型:在基础模型输入中叠加AhR/Nrf2活性预测值(基于公开数据库的机器学习模型),通过特征重要性分析筛选出与神经毒性显著相关的分子特征(如苯并[a]芘环、邻苯二甲酸酯基团等)
3. 多约束优化模型:在上述框架基础上引入BBB穿透性阈值(渗透率>3.2×10^-6 cm/s),确保预测结果符合神经毒性发挥的生理条件

虚拟筛选阶段应用该框架对7,576种POPs进行风险评估,筛选出12个高优先级化合物。分子对接验证显示:
- 9种化合物与AhR配体结合域形成稳定相互作用,包括氢键(3-5个/分子)、π-π堆积(2-3个/分子)及疏水结合(4-6个残基)
- 5种化合物与Nrf2的KEAP1结合口袋形成高亲和力结合(解离能-9.1至-10.2 kcal/mol)
- 所有靶点结合强度均超过已知的神经毒性阈值(AhR IC50 < 10 μM,Nrf2 IC50 < 1 μM)

研究突破体现在三个维度:
1. **机制解析**:首次建立AhR/Nrf2双通路协同作用的神经毒性预测模型,揭示氧化应激与神经退行性病变的分子关联
2. **预测效能**:在独立测试集(n=1,540)中实现AUC 0.81,交叉验证均方误差降低17.3%
3. **应用拓展**:构建包含12类POPs的优先筛查清单,其中3类化合物(多氯联苯、二噁英衍生物、有机锡化合物)同时满足AhR/Nrf2双通路激活和BBB穿透性要求

该框架在毒理预测领域展现出独特优势:通过引入分子互作亲和力( docking能量 < -8.5 kcal/mol)作为筛选条件,使预测的POPs在体外实验中表现出:
- 大鼠原代神经元存活率下降>40%(72h暴露)
- 神经丝轻链蛋白(Neurofilament-L)表达量上调2-3倍
- 丙二醛(MDA)含量增加1.8-2.5倍(p<0.01)

方法学创新体现在构建了多维度验证体系:
1. **内部验证**:采用10折交叉验证,模型稳定性系数(CV R2)达0.89
2. **外部验证**:在欧盟化学品注册局(ECHA)公开的127种神经毒性物质测试集中,实现92.6%的准确识别
3. **机制验证**:通过分子动力学模拟发现,含苯并[a]芘结构的化合物在AhR结合域形成稳定口袋,导致泛素-蛋白酶体系统抑制

研究对风险管理的实际贡献包括:
- 建立首个整合BBB穿透性的神经毒性预测模型,预测精度提升22.7%
- 筛选出12种高优先级POPs,其中5种在现有毒理学数据库中未标注神经毒性
- 开发开源工具包AOP-NeuroPredict,包含超过50万种化合物的预分类数据库和结构特征计算模块

未来发展方向建议:
1. 扩展通路覆盖:纳入TRPV1(瞬时受体电位 vanilloid 1)、MDR1(多药耐药蛋白1)等神经毒性相关通路
2. 完善数据库:增加神经胶质细胞特异性毒性数据(当前占比不足15%)
3. 优化预测模型:探索图神经网络在三维分子结构表征中的应用
4. 强化转化应用:建立虚拟筛选与体外实验的联动验证机制

本研究标志着计算毒理学从"黑箱预测"向"白箱解释"的重要转变,为替代动物实验提供了新的技术路径。特别是通过分子对接获得的结合能数据与QSAR模型的预测结果高度吻合(R2=0.76),验证了该框架在机制解析方面的可靠性。这种将化学信息学、计算生物学与毒理学深度融合的创新方法,为环境污染物和药物的安全评估开辟了新范式,具有显著的学科交叉价值和应用潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号