基于Mamba的适应性共形推断方法在概率短期负荷预测中的应用

《Knowledge-Based Systems》:Mamba based Adaptive Conformal Inference for Probabilistic Short-Term Load Forecasting

【字体: 时间:2025年08月09日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  电力负荷预测的六种非参数化概率方法评估:摘要 这篇研究评估了六种非参数化概率预测方法(ACI、DQR、BLSTM、CatBoost QR、Mamba ACI、Mamba QR)在泰米尔纳德邦电力负荷预测中的应用。通过对比覆盖率和区间宽度等指标,发现Mamba ACI在92.47%的覆盖率下平衡了预测精度和不确定性,而CatBoost QR虽区间最窄但覆盖率较低。研究证实ACI结合Mamba模型能有效提升短时负荷预测的可靠性。

  本研究旨在评估六种非参数概率负荷预测方法在短时负荷预测中的表现,其中包括Adaptive Conformal Inference (ACI)、Deep Quantile Regression (DQR)、Bayesian LSTM (BLSTM)、CatBoost Quantile Regression、Mamba ACI和Mamba QR。研究采用了3.4年的每小时负荷数据,基于这些数据,模型在未见过的数据集上进行了测试,该数据集涵盖了8.21个月的时间跨度。模型的评估基于覆盖率、平均区间宽度(MIW)、连续排名概率得分(CRPS)和Winkler得分等指标。结果表明,Mamba ACI在覆盖率上表现最佳,达到92.47%,平均区间宽度为峰值负荷的8.5%;LSTM ACI次之,其覆盖率和区间宽度分别为90.24%和5.9%。CatBoost虽然区间最窄(3.8%的峰值),但其覆盖率较低(83.81%)。DQR和BLSTM在性能上表现出中等水平,其中BLSTM的覆盖率和平均区间宽度分别为89.60%和8.0%的峰值负荷,体现了可靠性与精确度之间的平衡。然而,Mamba QR尽管覆盖率达到了90.29%,但其区间宽度却过于宽泛,达到26.9%的峰值负荷,这在实际应用中显得不切实际。研究强调了ACI在不同架构下对不确定性量化能力的平衡性,特别是在避免预测相关操作风险方面,Mamba ACI展现出较强的实用性与稳健性。

负荷预测在区域层面进行,通常是为了确保电网的稳定性与可靠性,以及优化能源调度。准确的负荷预测能够帮助电网运营商(DSO)提前预判电力需求的变化,从而保证电力供需的匹配。此外,精确的负荷预测还能够优化能源调度,降低运营成本,例如合理安排燃气发电厂和储能系统的启停。同时,它还支持DSO在电力市场中更有效地优化其市场参与策略。近年来,随着对峰值负荷管理、电力市场参与、需求响应计划和电动交通的重视,负荷预测的研究不断增多,涌现出了多种预测技术。这些技术可以大致分为四类:统计方法、机器学习方法、混合方法和信号处理方法。

统计方法包括回归分析、指数平滑和时间序列分析等,它们在传统能源领域中被广泛使用,并且具有计算速度快、数据需求量少的优势。然而,它们对非线性关系和非平稳性处理能力有限。机器学习方法如支持向量机(SVM)和决策树等,可以捕捉数据中的非线性关系,尤其适用于大规模数据集。但是,这些方法需要更多的数据支持,且模型解释性较差,容易出现过拟合现象。混合方法通过结合统计模型和机器学习模型,进一步提升了预测精度,但同时也增加了模型的复杂度和对参数集成的依赖性。信号处理方法则通过分解时间序列数据为更简单的组成部分,如经验模态分解(EMD)或小波变换,再对各个组成部分进行预测,最后将预测结果进行重构。这种方法在处理非平稳数据方面具有优势,但对分解方法的敏感性较高,且需要复杂的预处理和后处理。

研究中,ACI被用于在LSTM和Mamba模型的基础上进行不确定性量化。ACI是一种框架,能够为任何预测模型生成预测区间,包括被认为是“黑箱”模型的先进机器学习或深度学习模型。ACI的核心优势在于其不需要对数据的底层分布做出任何假设,同时能够提供高覆盖率(即预测区间包含真实值的概率)和合理的区间宽度。这使得ACI在处理不确定性方面具有显著优势。相比传统的QR方法,ACI在处理数据分布变化时更具适应性,它通过动态调整预测区间宽度来应对预测误差的变化,从而在预测精度和不确定性估计之间实现了良好的平衡。

此外,DQR方法在预测过程中直接优化特定的分位数损失函数,从而能够更有效地捕捉数据中的不确定性。然而,其生成的预测区间宽度较大,且在覆盖率上表现较弱。BLSTM方法通过在训练过程中引入贝叶斯先验,使得模型在训练和推理阶段都能够自然地量化预测不确定性,这种方法在训练过程中通过蒙特卡洛(MC)丢弃采样来近似网络参数的后验分布。这种集成式的方法能够生成反映数据变异性的预测区间,而无需额外的后处理调整。然而,由于MC采样过程计算量较大,这种方法在实际应用中可能会带来较高的计算成本。

CatBoost方法则是一种梯度提升算法,特别适用于处理数值和分类特征。与传统梯度提升方法不同,CatBoost通过有序提升和目标统计(TBS)等技术来减少目标泄漏和控制过拟合,从而提高模型的泛化能力。研究中,CatBoost被用于估计目标变量的下分位数和上分位数,以及中位数。通过调整分位数损失函数,CatBoost能够生成具有良好校准和精确度的预测区间。

研究中还涉及了特征的编码和归一化。时间特征如小时、星期几和月份被通过正弦和余弦变换进行编码,以保留周期性特征的连续性和结构。特征归一化是通过最小-最大归一化方法进行的,使得每个输入特征在模型训练过程中能够贡献相同比例。这不仅加快了训练过程,还提升了模型从数据中学习的能力。

实验结果表明,Mamba ACI在所有评估方法中表现最为出色,实现了最高的覆盖率,同时保持了合理的区间宽度。这种表现使其成为非常短时负荷预测中具有实际操作价值和鲁棒性的最佳选择。研究进一步指出,ACI不仅适用于LSTM模型,还能够与Mamba等新型序列建模架构结合,从而在不同不确定性量化框架下展现出良好的适应性。这表明,ACI在处理负荷预测任务中的不确定性时,能够有效地动态调整预测区间,从而在预测精度和不确定性估计之间取得良好的平衡。

此外,研究还探讨了不同方法在不确定性量化方面的优缺点。ACI在实际应用中展现出较强的稳健性,其预测区间能够提供较高的覆盖率,同时保持一定的精度。相比之下,DQR虽然在生成较窄的预测区间方面表现良好,但在覆盖率方面有所不足。BLSTM通过贝叶斯方法引入不确定性估计,但其计算成本较高。CatBoost虽然在生成较窄的预测区间方面表现出色,但在覆盖率方面有所欠缺,这表明其在市场驱动或风险容忍度较高的环境中可能更具优势。Mamba QR虽然基于强大的确定性模型,但其预测区间过于宽泛,导致在实际应用中缺乏操作性。

研究总结指出,Mamba ACI作为不确定性量化方法,在所有评估模型中展现出最佳的平衡性,不仅具有较高的覆盖率,还能提供合理的预测区间宽度,从而满足实际电网运营中对可靠性和精确度的双重需求。研究还建议未来可以探索将CatBoost的精确度与ACI的校准能力相结合的混合方法,以及开发适应性调整策略和基于元学习的分位数校正技术,以进一步提升这些方法在实际应用中的表现。此外,通过在天气增强数据集和多个地区进行更广泛的基准测试,可以进一步验证这些方法的实用性和适应性。总的来说,ACI增强的LSTM和Mamba架构在负荷预测的可靠性、精确度和可扩展性方面展现出良好的平衡,因此在实际的不确定性量化系统中具有广泛的应用前景。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号