零售需求预测中全局模型重训练频率的优化策略及其对计算效率与可持续性的影响

《Machine Learning with Applications》:On the retraining frequency of global models in retail demand forecasting

【字体: 时间:2025年10月27日 来源:Machine Learning with Applications 4.9

编辑推荐:

  本研究针对零售需求预测中全局模型(GM)频繁重训练带来的高计算成本与环境影响问题,系统评估了10种机器学习(ML)与深度学习(DL)模型在不同重训练场景下的性能。结果表明,降低重训练频率(如每月一次)可在保持预测精度的同时显著降低计算成本(最高达90%),为大规模预测任务提供了更可持续的解决方案。研究挑战了“频繁重训练提升精度”的传统认知,为优化企业预测流程提供了实践指南。

  
在当今计算能力飞速增长与环境意识日益增强的时代,各类组织在利用预测模型支持决策时面临着一个关键挑战:如何在提升预测模型准确性的同时,平衡计算效率与可持续性发展。特别是在零售行业,需求预测直接关系到库存管理、供应链优化以及企业盈利能力。过度预测会导致库存积压和浪费(尤其是对易腐商品),而预测不足则会造成缺货,直接给公司带来经济损失。传统上,时间序列预测采用局部建模方法,即为每个时间序列单独训练模型。然而,近年来,全局预测模型(Global Forecasting Models, GM),也称为交叉学习,显示出巨大潜力。这种方法通过在整个数据集上拟合单一预测模型,利用跨多个时间序列的信息,通常能提高准确性和泛化能力。
尽管全局模型的应用日益广泛,但业内的常见做法仍然是每当获得新的观测数据时就更新预测模型。这通常基于一个假设:持续更新能使模型更好地适应变化模式,从而获得更准确的预测。然而,与局部模型不同,全局模型通过从多个时间序列中学习共享的动态特征,可能具有更稳健的表示,对频繁重训练的敏感性较低。频繁重训练会带来显著的计算成本和环境代价。训练大规模预测模型需要大量的计算能力,从而导致能源消耗和碳排放增加。有研究表明,训练一个大型深度学习模型所产生的碳排放量相当于五辆汽车整个生命周期的排放量。在处理数百万个序列的大型组织中,模型重训练的频率会极大地放大这种环境影响。
那么,一个核心问题浮出水面:在零售需求全局预测模型的背景下,频繁重训练是否真的必要?全局模型是否可以在没有频繁更新的情况下依然保持有效的预测性能?为了回答这个问题,来自意大利米兰比可卡大学经济管理与统计系的Marco Zanotti进行了一项深入研究,其成果发表在《Machine Learning with Applications》上。
研究人员旨在扩展Spiliotis和Petropoulos(2024)具有影响力的工作成果,具体探究“在零售需求全局预测模型的背景下,频繁重训练是否必要?”为此,他们使用了两个最新、最全面的零售预测数据集——M5竞赛数据和VN1竞赛数据。为了全面理解重训练对预测模型性能的影响,他们考虑了十种不同的全局预测方法(五种来自“经典”机器学习领域,五种是常用的深度神经网络架构),以及几种可能的重新训练方案,从连续更新到完全不重新训练。此外,还探索了中间状态的周期性重训练策略,以广泛覆盖最合理和有效的场景。研究还重点关注了准确性与可持续性(即产生预测所需的资源计算成本)之间的权衡。
为开展研究,作者团队主要应用了以下几项关键技术方法:首先,采用滚动原点评估(Rolling Origin Evaluation)这一广泛认可的时间序列验证方法,模拟了多个预测周期,以更全面地评估模型在不同条件下的性能,例如使用扩展窗口策略来贴近业务现实。其次,研究涵盖了丰富的模型体系,包括机器学习中的线性回归(LR)、随机森林(RF)、XGBoost、LightGBM(LGBM)、CatBoost,以及深度学习中的多层感知器(MLP)、循环神经网络(RNN)、时间卷积网络(TCN)、NBEATSx和NHITS,确保了评估的广泛性和代表性。最后,在评估指标上,不仅使用了点预测指标如均方根缩放误差(RMSSE),还重点评估了概率预测性能,采用了缩放多分位数损失(SMQL)来衡量区间预测的准确性,并直接使用计算时间(CT)来量化预测成本。
4. 结果与讨论
4.1. 预测准确性(点预测)
如论文图1所示,除了CatBoost模型外,各种模型的RMSSE曲线在不同重训练频率下都非常稳定。在M5数据集上,准确度几乎保持不变;而在VN1数据集上,甚至有所改善,无论考虑哪种重训练场景。特别是对于周期性的低频率重训练场景,大多数全局模型的性能与基线场景(连续重训练或每周重训练)难以区分。即使对于更高的重训练频率(即更少次数的重训练),性能有所下降,但在完全不重训练的情况下,下降幅度也小于5%。这些结果表明,降低重训练频率并不会损害全局模型的点预测精度。这可以解释为,如果需求模式保持稳定,没有显著的趋势或概念漂移,正如M5和VN1数据集所表现的那样,预测模型能够在较长时间内准确跟踪需求。
4.2. 预测准确性(概率预测)
在概率预测设置下,结果略有不同。如论文图2所示,对于M5数据集,模型的准确度(以多分位数损失衡量)随着重训练频率的增加(即重训练间隔变长)而明显增加,这意味着较少的更新会损害模型的概率预测性能。这种现象在所有方法中均存在。然而,对于低重训练场景,准确度的差异是微乎其微的;对于高重训练水平,差异略微明显,但无论如何都低于5-6个百分点。同时,注意到机器学习和深度学习模型在性能上存在微小差异,前者随着重训练场景的增加,性能下降更为平缓。对于VN1数据集,则观察到准确度与重训练周期之间几乎呈凸函数关系。平均而言,模型的性能在低重训练场景下有所改善,然后在r=4左右开始恶化。唯一的例外是NBEATSx和NHITS模型,它们在较长的重训练场景下,无论是点预测还是概率预测,表现都持续优于其他模型。
4.3. 计算时间与成本分析
计算时间分析结果(论文图3)显示,CT随着重训练场景的增加呈指数级下降。平均而言,M5和VN1的减少幅度相似:从基线场景切换到第一个周期性重训练场景(r=14或r=2)几乎使CT减半,每月重训练一次模型通常可减少75%的计算时间,而在不重训练的场景下,这种减少达到90%。然而,在M5数据中,机器学习和深度学习模型之间存在显著差异。前者的CT持续下降,而后者似乎稳定在50%左右,随着重训练场景的增加,增益要低得多。正如预期,这种差异在VN1数据集中不太明显,因为它比M5数据集更小、频率更低。
将计算时间转化为实际成本后(论文图4和图5),研究发现在日度数据上,使用机器学习模型进行预测的成本通常低于深度学习模型。平均而言,连续重训练场景的成本约为75万美元,而在不重训练场景下,该成本降至近25万美元,意味着直接节省超过60%。此外,机器学习模型允许更高的节省。即使模型需要更新,从每周重训练改为每月重训练,可直接节省近75%的成本,而对于深度学习模型,可能低于30%。这意味着,随着数据频率的增加,机器学习方法是与较低频率模型重训练策略相结合以降低预测成本的略优选择。对于周度数据,这些差异不太明显,意味着机器学习和深度学习模型通常具有非常相似的成本和节省曲线。在这种情况下,连续重训练场景下的平均预测成本为25万美元(是日度数据的三分之一),在最不频繁的重训练场景下,它降至1.5万美元,产生90%的直接节省。
4.4. 最佳重训练频率探索
研究还探索了每个时间序列的“最佳”重训练频率。论文图6表明,尽管某些序列可能受益于频繁重训练,但在大多数情况下,较低频率的模型重训练能带来更好的准确性和效率。对于点预测,M5数据集的最佳重训练频率在3到4周(约21个观测值)之间,VN1数据集则在8到10周左右。在概率预测的背景下,最佳重训练间隔较短,M5约为2周,VN1约为4周,这表明不确定性估计可能需要更频繁的更新以保持准确的水平。
本研究通过超越预测模型的传统评估范畴,深入探讨了生成预测相关的计算成本。研究结果对持续模型重训练的传统观念提出了挑战。证据表明,显著降低重训练频率,全局模型的预测精度仍能保持稳定。对于点预测,降低重训练频率不会导致性能显著下降;对于概率预测,性能的降低相对较小。最重要的是,计算成本随着重训练频率的降低呈指数级减少。
这些发现对学术研究和工业应用都具有高度现实意义。它们动摇了“预测模型需要频繁更新以保持高性能”的普遍假设,表明全局模型在较长时间内仍然有效,重训练可以战略性地规划而非持续进行。对于从业者而言,研究提供了具体的指导:通常,每月重训练一次是在概率精度和成本之间取得平衡的可行方案;若预测目标侧重于点预测,则可采用更长的重训练方案。研究还揭示了机器学习和深度学习模型在计算上的比较:随着数据频率的增加,前者从较低频率重训练中获益更多。因此,在零售业等大规模应用中,机器学习模型与较低频率重训练策略相结合是减少预测成本的略优选择。
此外,该研究对机器学习和人工智能驱动预测的可持续性具有更广泛的影响。减少重训练相关的计算成本节省直接转化为更低的能耗,使预测操作更加环境友好。这与近期关于“绿色AI”的讨论高度契合,强调了优化计算资源以减少机器学习应用环境影响的必要性。
总之,这项研究证实,维持全局模型的高预测精度并不必然需要频繁重训练。较低频率的重训练可以显著降低计算成本,同时保持有竞争力的预测性能。这些发现为寻求优化其预测流程的组织提供了重要启示,指明了一条通向更高效、更可持续预测实践的道路。通过从持续重训练模式转向周期性重训练方法,企业可以在确保高预测性能的同时,实现显著的成本节约和环保效益。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号