基于SHAP可解释性混合机器学习模型的生物滞留系统氮磷靶向去除优化研究

【字体: 时间:2025年07月31日 来源:Journal of Water Process Engineering 6.7

编辑推荐:

  针对生物滞留系统(BRS)营养盐去除效率不稳定问题,研究人员通过整合1052组实验数据,开发了融合随机森林与梯度提升(RF+XGB)的混合机器学习模型,结合SHAP解释性分析揭示了NH4+-N、NO3?-N、TN和TP去除的关键阈值(如ADWP=3-4天时NO3?-N去除最优),为海绵城市低影响开发设施提供了数据驱动的设计优化方案。

  

随着城市化进程加速,不透水地表面积激增导致自然水文循环破坏,城市内涝与面源污染问题日益严峻。在此背景下,海绵城市建设中的生物滞留系统(BRS)因其成本效益比高、适应性强的特点,成为控制雨水径流污染的关键技术。然而这类系统存在一个突出矛盾:虽然对悬浮物(TSS)和重金属的去除稳定高效,但对氮磷营养盐的去除效率却波动显著——有时甚至出现氮素浸出现象。这种不稳定性源于介质组成、植被类型等设计参数与干旱前期(ADWP)、水力负荷等环境因素间的复杂互作,使得传统经验式设计难以实现精准优化。

重庆交通大学河海工程学院的研究团队在《Journal of Water Process Engineering》发表的研究,创新性地将可解释机器学习引入BRS优化领域。通过整合61篇文献的1052组实验数据,系统评估了多元线性回归(MLR)、随机森林(RF)和梯度提升(XGB)算法,最终开发出混合RF+XGB模型,其测试集R2达0.74-0.85(氮组分)和0.66(TP)。结合SHAP力解释技术,首次量化揭示了介质有机/矿物比例与水力学控制的协同作用机制,为BRS设计提供了突破性的数据支撑。

研究采用三阶段方法:首先构建涵盖12项设计参数和8项环境因子的全球数据库;继而通过特征重要性排序与超参数调优开发混合模型;最后运用SHAP加性解释和偏依赖图(PDPs)解析关键变量阈值。特别值得注意的是,研究团队创新性地将RF的特征选择能力与XGB的预测精度相结合,使模型兼具85%的预测准确率和明确的工程指导性。

特征交互分析揭示了多尺度调控规律:NH4+-N去除在入流通量(IF)380-400mm、ADWP2-3天、矿物含量(MC)15%-25%时达到峰值;NO3?-N去除则需ADWP3-4天配合3%有机质与60%-90%砂含量;TN去除依赖IF<400mm与2%有机质+5%矿物的协同作用;TP去除与进水浓度(Cin>3mg/L)强相关,最佳IF范围为100-400mm。这些发现颠覆了传统认知——例如过高的有机质含量虽促进TP吸附,却会因分解作用导致氮素释放,揭示了介质组分"双刃剑"效应的分子机制。

结论部分强调,该研究实现了从"黑箱预测"到"机理阐释"的跨越:首次通过SHAP力曲线量化了ADWP对NH4+-N去除的非线性影响,发现干旱期延长既可通过培育厌氧环境促进反硝化,又会抑制硝化菌活性。这种基于数据驱动的阈值解析,为破解BRS设计中"提高除磷效率却加剧氮泄漏"的工程悖论提供了新思路。研究建立的混合模型框架,可实时响应降雨强度、温度等动态变量,推动海绵城市设施从静态设计向智能调控演进。

这项研究的意义不仅在于开发了当前BRS领域预测精度最高的模型(R2提升达27%),更开创了机器学习可解释性技术在低影响开发(LID)设施优化中的应用范式。通过将SHAP值与偏微分方程结合,研究人员成功解码了传统水文模型中难以量化的"微生物-介质-水力"三元耦合机制,为智慧水务时代的雨洪管理提供了普适性分析工具。团队公开的全球规模数据库,也为后续跨气候带比较研究奠定了重要基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号