基于连接器与经验模态分解(EMD)的短时间序列预测研究新突破

【字体: 时间:2025年02月28日 来源:Scientific Reports 3.8

编辑推荐:

  研究人员针对短时间序列预测难题,开展基于连接器和 EMD 的研究,有效提升预测精度。

  在当今数据驱动的时代,时间序列预测广泛应用于众多领域,从股票价格的波动预测,帮助投资者把握财富密码;到天气预报,为人们的日常出行和生产活动提供指引;再到交通流量的预估,助力城市交通的高效管理。然而,短时间序列预测却如同隐藏在暗处的 “荆棘”,让研究者们头疼不已。
短时间序列的样本数量有限,就像拼图缺了许多关键碎片,使得经典预测模型难以从中挖掘出完整的规律。简单地将这些短序列拼接成长序列看似是个办法,但实际操作起来却问题重重。不同序列间数值差异大,拼接处就像突兀的 “补丁”,会严重破坏数据的周期性和规律性,让后续的预测结果大打折扣。面对这些困境,研究人员急需找到一种新的方法,来突破短时间序列预测的瓶颈。

吉林大学和长春大学的研究人员勇挑重担,开展了一项关于 “Connector based short time series prediction” 的研究,相关成果发表在《Scientific Reports》上。这项研究意义非凡,它为短时间序列预测提供了新的思路和方法,有望提升预测的准确性,从而为相关领域的决策提供更可靠的依据。

在研究方法上,研究人员采用了多种关键技术。首先是经验模态分解(EMD),这是一种用于处理非线性和非平稳序列的方法,能将序列分解成一系列固有模态函数(IMF)子序列和一个残差,就像是把一团乱麻梳理成一根根整齐的线,帮助提取不同的周期特征。其次,研究人员创新性地引入了两种连接器,即线性插值连接器(LIP)和线性插值与随机振动叠加连接器(LRV),用于解决序列拼接时的不连续问题。此外,数据预处理中的归一化操作也至关重要,包括分别归一化和全局归一化,通过对比来确定最适合的方式。

研究结果主要包括以下几个方面:

  • 连接器有效性:通过在 5 个真实世界数据集(如美国月度零售销售数据集 MRTS、股票价格数据集 Stock - D/Stock - W/Stock - M 和社会经济地位得分数据集 SES)上进行实验,使用平均绝对误差(MAE)、均方根误差(RMSE)、平均绝对百分比误差(MAPE)和决定系数(R2)等指标评估。结果发现,在 MRTS 数据集上,LRV 连接器的预测效果优于直接拼接;而在其他四个数据集上,LIP 连接器的表现更优。这表明不同类型的连接器适用于不同特性的数据集,对于具有明显周期性特征的数据集,LRV 连接器能更好地捕捉和保留数据的周期性;对于缺乏明显周期性的数据集,LIP 连接器则更合适12
  • 连接器长度影响:以 MRTS 数据集为例,研究不同长度的连接器对结果的影响。发现连接器过短会导致子序列在相应位置出现高振幅,过长则会增加序列分解的开销。当使用 LIP 连接器时,随着连接序列长度增加,IMF4中四个连接点与其他区域的振幅差异逐渐减小,s = 80 时基本消除;使用 LRV 连接器时,在 IMF4中,s = 50 时该差异基本消除。这说明选择合适的连接器长度对于优化预测结果十分关键34
  • 归一化效果:对比了全局归一化和分别归一化两种方式。结果显示,对于 MRTS 和 SES 数据集,除了 SES 数据集在 MAPE 指标上,分别归一化的效果均优于全局归一化。在 MRTS 数据集中,分别归一化后得到的短中期子序列峰值分布更均匀,且网络对其拟合效果更好;而全局归一化在分解后的两个短期规律序列 IMF1和 IMF2上出现严重过拟合。这表明分别归一化能更有效地处理多序列数据,减少数据变异性,提高预测准确性56

研究结论和讨论部分指出,该研究提出的在拼接序列间插入连接器的预处理方法,有效缓解了直接拼接带来的问题,显著提高了预测精度。不过,目前该方法也存在一些局限性,比如缺乏对理想连接器的理论论证,没有系统的标准来评估发现的周期性特征等。但这也为后续研究指明了方向,激励更多科研人员深入探索,进一步完善短时间序列预测的方法。总的来说,这项研究为时间序列预测领域开辟了新的道路,其成果对于推动相关领域的发展具有重要的意义,让我们对未来更精准的时间序列预测充满期待。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号