
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于WLOF-DENS融合算法的NaCl-Na2SO4-H2O三元体系溶解度精准预测模型研究
【字体: 大 中 小 】 时间:2025年06月16日 来源:Chinese Journal of Chemical Engineering 3.7
编辑推荐:
针对传统热力学模型在宽温域(-20~150°C)溶解度预测中的局限性,中国科学院团队创新性提出结合加权局部离群因子(WLOF)和深度集成神经网络(DENS)的数据驱动方法。该研究通过异常值检测优化数据集质量,采用贝叶斯超参数优化构建预测模型,最终在NaCl-Na2SO4-H2O体系中获得0.989的决定系数,为盐湖资源开发和废水处理提供新工具。
在西北地区热循环法盐硝联产技术中,NaCl-Na2SO4-H2O三元体系作为核心原料系统,年产量可达130万吨芒硝,广泛应用于医药、相变储热等领域。然而该体系溶解度呈现特殊温度依赖性:Na2SO4在32.38°C以下溶解度骤增,之后随温度升高逐渐降低,这种非线性变化使传统Pitzer模型面临巨大挑战。虽然Pitzer模型通过参数回归能实现局部预测,但需要复杂温度修正参数,且在宽温域预测时精度显著下降。
针对这一难题,青海大学联合研究团队在《Chinese Journal of Chemical Engineering》发表创新成果。研究采用多源实验数据整合策略,首先运用加权局部离群因子(WLOF)算法进行局部异常值检测,相比传统Z-score和IQR方法,能更好保留数据分布特征;随后构建深度集成神经网络(DENS)架构,集成多个DNN子模型以降低个体偏差;最终通过贝叶斯优化(BO)调参,建立覆盖-20~150°C的溶解度预测模型。
关键技术包括:1) 整合273.15-423.15K多源实验数据;2) 对比Z-score/IQR/WLOF三种异常检测方法;3) 构建含注意力机制的DENS框架;4) 贝叶斯超参数优化。
【数据预处理】
通过WLOF算法识别局部密度异常点,相比全局检测方法更适应实验条件差异导致的分布不均问题,使模型R2从0.878提升至0.958。
【模型构建】
深度集成神经网络整合LSTM和CNN特征提取优势,各子模型采用不同初始化权重和dropout率(0.2-0.5),通过Bagging策略降低方差。
【超参数优化】
贝叶斯优化确定关键参数:学习率(1×10-4)、批量大小(64)、隐藏层数(5),使DENS模型R2进一步提升至0.989。
【结论与意义】
该研究突破传统热力学模型依赖特定参数的局限,证明数据驱动方法在复杂体系溶解度预测中的优越性。模型对芒硝结晶工艺优化、煤化工高盐废水处理具有直接指导价值,其WLOF-DENS框架可扩展至其他多元水盐体系预测。研究数据与代码已在GitHub开源,促进领域内方法学创新。
生物通微信公众号
知名企业招聘