使用先进的机器学习模型预测二氧化碳在水和盐水中的溶解度

《Geoenergy Science and Engineering》:Predicting CO 2 solubility in water and brines using advanced machine learning models

【字体: 时间:2025年10月07日 来源:Geoenergy Science and Engineering 4.6

编辑推荐:

  CO?溶解度预测模型研究提出融合三种优化算法(ALA、BKA、IVYA)与LightGBM/XGBoost的机器学习模型,基于3383组实验数据构建,涵盖纯水及多盐体系。实验表明BKA-LightGBM模型性能最优(R2=0.9930,RMSE=0.0007),显著优于传统CPA-MHV1方程,且通过SHAP解释和杠杆图验证了模型可靠性与抗异常能力,适用于地质封存工程中的CO?溶解预测。

  在当今全球气候变化日益严峻的背景下,减少工业排放已成为各国政府和科研机构关注的焦点。二氧化碳(CO?)作为主要的温室气体之一,其在大气中的浓度持续上升,导致全球变暖和极端气候事件频发。因此,碳捕集与封存(CCS)技术作为一项关键的碳减排手段,受到了广泛重视。CCS技术通过在排放源处捕获CO?,并将其注入深部地质构造中进行长期封存,从而有效降低碳排放对环境的影响。其中,深部咸水层因其丰富的储量和高封存能力,成为当前CCS技术研究与应用的重点对象。

为了确保CO?在地下咸水层中的长期稳定封存,深入了解其在盐水系统中的物理与化学行为至关重要。特别是在高压和高盐度条件下,CO?的溶解特性直接影响其迁移路径、分布范围以及整个封存系统的安全性。因此,准确预测CO?在不同盐度水中的溶解度对于评估CCS技术的可行性、优化封存策略以及保障封存过程的安全性具有重要意义。然而,目前的研究多集中在特定盐水系统的建模,缺乏对实际工程场景的广泛验证,这限制了模型的适用性与可靠性。

为了弥补这一不足,本文提出了一种适用于纯水、单盐溶液和混合盐溶液的CO?溶解度模型。通过构建一个包含3383组实验数据的数据库,该模型能够更全面地反映地下环境的复杂性。输入变量包括温度、压力以及NaCl、KCl、Na?SO?、MgCl?和CaCl?等五种常见盐类的浓度,输出变量为CO?的溶解度。为提高预测精度,研究团队采用三种优化算法——人工沙鼠算法(ALA)、黑翼鹰算法(BKA)和IVY算法(IVYA)——对两种机器学习模型(LightGBM和XGBoost)进行调优。结果显示,BKA-LightGBM模型在预测精度和计算效率方面均表现出色,其R2值达到0.9930,均方根误差(RMSE)为0.0007,平均绝对相对误差(AARD)为7.41%,显著优于传统的CPA-MHV1模型。此外,基于SHAP(SHapley Additive exPlanations)方法的可解释性分析表明,压力是影响模型输出的最关键输入参数。

在数据可靠性方面,研究团队采用基于Williams图的杠杆法检测数据中的异常值,结果显示90.63%的样本点位于杠杆阈值0.3以内,有效降低了异常值对模型训练的干扰。同时,通过交叉验证和外部验证,进一步证明了BKA-LightGBM模型在实际工程应用中的有效性,特别是在CO?溶解捕集方面具有广阔的应用前景。这些结果表明,BKA-LightGBM模型不仅在预测精度上表现优异,而且具备良好的泛化能力和稳定性,为CCS技术的发展提供了有力的支持。

在CO?溶解度预测领域,已有大量研究尝试利用机器学习算法进行建模。例如,Mohammadian等人使用XGBoost模型对164组实验数据进行了分析,研究了CO?在低盐度储层中的注入影响。Menad等人则对纯水和NaCl溶液中的CO?溶解度进行了建模分析,覆盖了更广泛的温度和压力范围。Wei等人开发的模型在回归性能方面表现突出,R2值高达0.995,实现了高精度的预测。Raji等人基于608组实验数据,利用四种不同的机器学习模型预测了CO?在不同盐度溶液中的溶解度,并引入了新的描述符,如氢键受体数量和盐的分子量,为人工智能建模提供了新的思路。Jeon和Lee提出了一种基于人工神经网络(ANN)的预测方法,该方法在多种水系统中实现了高精度的预测,但其在实施过程中需要考虑熵和焓的计算,增加了复杂性。Zou等人利用1278组实验数据构建了一个模型,成功预测了含有六种不同盐类的盐水中的CO?溶解度,但该研究未使用独立测试集或交叉验证,影响了模型的可重复性和鲁棒性。Ratnakar等人提出了一种基于机器学习的预测框架,通过合成数据扩充训练集,解决了实验数据不足的问题,其模型的预测误差控制在2%至7%之间。然而,该模型依赖于Setschenow系数来估算盐水中的CO?溶解度,未能全面反映复杂的溶解行为。Nabipour等人则引入了极端学习机(ELM)和最小二乘支持向量机(LSSVM)两种方法,用于预测非烃类气体在不同电解质溶液中的溶解度,并基于774组实验数据进行了比较分析,结果显示ELM在预测性能上略优于LSSVM。此外,研究还揭示了离子强度、气体浓度、压力和温度等因素对CO?溶解度的影响。Mwakipunda等人提出了一种结合遗传算法(GA)和混合效应随机森林(MERF)的混合模型(GA-MERF),该模型在准确性和计算速度之间取得了良好的平衡,为CCS研究和实际应用提供了有价值的工具。

尽管上述研究在CO?溶解度预测方面取得了一定进展,但大多数模型仍然局限于单一盐类或简单的多盐系统,如NaCl、KCl和CaCl?等。这种局限性使得模型难以广泛适用于各种地质封存环境,特别是在处理多组分盐水系统时表现不佳。此外,许多机器学习模型的评估缺乏独立数据集的验证或交叉验证,这引发了对其泛化能力和稳定性方面的担忧。因此,开发一种计算效率高、预测能力强且适用于多种盐度环境的混合模型,成为当前研究的重要方向。

本文的研究工作正是在这一背景下展开的。首先,研究团队构建了一个包含3383组实验数据的综合数据库,涵盖了纯水、单盐溶液和多组分盐水系统,从而更真实地反映地下环境的复杂性。其次,考虑到数据集的复杂性,研究团队对不同盐水系统中的异常值进行了识别和剔除,确保模型训练基于稳健且具有代表性的数据。第三,研究团队采用三种新型元启发式优化算法(ALA、BKA和IVYA)对两种强大的机器学习模型(LightGBM和XGBoost)进行调优,从而提升模型在不同盐水系统中的预测性能。第四,研究团队建立了一个稳健的建模流程,包括基于SHAP的可解释性分析、基于杠杆图的异常值检测,以及利用交叉验证和独立测试集进行的全面验证。最后,与以往研究相比,本文的方法不仅覆盖了更广泛的盐度条件,还保持了良好的泛化能力和物理一致性,为CCS技术的进一步发展提供了坚实的基础。

综上所述,本文通过构建一个全面的实验数据库、采用多种优化算法对机器学习模型进行调优、并引入稳健的建模流程,成功开发了一种适用于多种盐度环境的CO?溶解度预测模型。该模型在预测精度和计算效率方面均表现出色,特别是在纯水和混合盐水中实现了较高的预测能力。此外,该模型在实际工程应用中的有效性得到了充分验证,为CO?溶解捕集等CCS技术的推广提供了重要的支持。未来的研究可以进一步探索该模型在不同地质条件下的适用性,以及如何将其与其他物理化学模型相结合,以提高预测的全面性和准确性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号