基于IVY特征选择和KAN参数优化预测电动汽车的剩余行驶里程

《Journal of Cleaner Production》:Prediction of remaining driving range for electric vehicles based on IVY feature selection and parameter optimization of KAN

【字体: 时间:2025年10月01日 来源:Journal of Cleaner Production 10

编辑推荐:

  准确预测电动汽车剩余续航里程(RDR)对用户体验和电池管理至关重要。本文提出IVY-FSPOKAN框架,结合IVY算法进行特征筛选与参数优化,并利用Kolmogorov-Arnold网络(KAN)提升预测精度,同时通过SHAP分析揭示特征影响机制。实验表明,该框架在多个评估指标上优于13种传统机器学习算法,且验证了多季节数据下的稳定性。

  电动汽车的剩余续航里程(RDR)预测对于提升驾驶体验和优化电池管理系统具有重要意义。然而,当前的研究在特征选择和模型参数优化这两个预测建模的核心环节中仍存在诸多局限,未能充分发挥关键特征的预测潜力。为了解决这些问题,本文提出了一种基于IVY算法的Kolmogorov-Arnold网络(KAN)特征选择与参数优化框架,即IVY-FSPOKAN。该框架通过IVY算法优化特征组合,并结合KAN的结构和超参数,提升了预测的准确性和稳定性。实验结果表明,该框架在三种评估指标上均优于其他常用的机器学习算法,且具有显著的统计差异。此外,通过Shapley Additive Explanations(SHAP)方法对所选特征的重要性进行分析,直观揭示了这些特征如何影响RDR,并为模型性能提供了解释性支持。

随着全球能源危机的加剧和环保意识的提升,电动汽车,尤其是纯电动汽车(BEVs),因其在环境可持续性和能源效率方面的独特优势而被广泛采用。然而,电动汽车续航里程有限的问题仍然是用户关注的重点,这一问题导致了“续航焦虑”的出现,成为优化用户体验和推动电动汽车普及的关键障碍。为了有效应对这一挑战,除了技术上的进步,如延长续航里程外,准确预测剩余续航里程已成为当前研究的核心目标。此类预测不仅有助于驾驶员规划路线和充电时间,还在提升电动汽车整体能效管理与驾驶安全方面发挥着重要作用。

电动汽车的剩余续航里程指的是车辆在完全充电状态下能够行驶的距离,这一数值受到多种复杂因素的影响,包括车辆状态、驾驶环境以及外部环境系统。研究人员已经尝试了多种方法来提高RDR预测的准确性,这些方法大致可以分为两类:基于模型的方法和基于数据驱动的方法。基于模型的方法主要通过建立电池模型来探索剩余电池能量与RDR之间的关系。在这些方法中,RDR通常依赖于电池的剩余可放电能量(BatRDE)和车辆的平均能耗(avg_e),如公式(1)所示。BatRDE的计算方法如公式(2)所示,从该公式可以看出,电动汽车的剩余能量主要受电池状态(SOC)和电压的影响。因此,传统方法常以SOC作为电池剩余能量的代理指标,从而估计RDR。然而,SOC的估计方法在实际应用中受到电池老化、温度波动和实验条件等因素的限制,导致传统SOC估计方法在动态驾驶场景下的实用性受到挑战。

另一方面,电动汽车的能耗受到多种复杂因素的影响,如交通状况、驾驶行为和环境温度。例如,在复杂的路况下频繁的加速和制动会显著增加能耗,而平稳驾驶则更加节能。此外,极端温度条件会影响电池效率,从而间接影响SOC估计和能耗预测的准确性。因此,仅依赖SOC与驾驶范围之间的映射关系进行RDR预测的方法在复杂驾驶环境下适用性有限。为了提高预测精度,研究人员开始将SOC估计与能耗预测相结合,开发更复杂的模型。例如,Sun等人(2022)应用了隐马尔可夫模型(HMM)并结合驾驶路线信息,设计了一种新的预测方法,能够基于未来的能耗和可放电能量来估计电池电动汽车的RDR。Jiang和Zhang(2023)则整合了地图API和机器学习算法,实现了对纯电动汽车未来驾驶条件的实时在线预测,从而准确估计电池SOC和RDR。这些方法为复杂驾驶环境下RDR预测提供了新的解决方案。

尽管RDR预测方法有所进步,但当前研究仍存在一些不足。首先,微观层面的能耗指标研究仍显不足。虽然RDR预测已有大量研究,但大多数工作集中在估算总剩余续航里程,这些总体指标只能提供粗略的指导,难以全面反映驾驶行为和环境条件对能耗的影响。为了克服这一局限,本文聚焦于建模“每SOC单位距离的能耗”(DDPSOC),该指标能够更准确地刻画SOC与驾驶范围之间的非线性关系,并反映能耗的细微变化。然而,DDPSOC的研究仍较为有限,因此本文通过引入DDPSOC作为预测目标,填补了这一研究空白,进一步推动了微观能耗建模的发展。

其次,预测模型的可解释性仍是一个重要挑战。尽管现有的机器学习和深度学习模型在预测精度上有了显著提升,但它们的可解释性仍然有限。这些模型虽然能够提供高精度的预测结果,却难以揭示输入特征与目标变量之间的因果关系,使得关键特征的重要性及其贡献机制难以明确。这种可解释性的缺乏限制了模型的针对性优化,并影响了其在实际中的广泛应用。

第三,特征选择和参数优化的研究方法仍需深入探讨。现有机器学习和深度学习模型在预测任务中的性能差异主要取决于两个关键因素:输入特征的选择和算法超参数的设置。随着影响剩余续航里程的因素不断增加,相关预测特征的数量也相应扩大。然而,将所有特征直接输入模型不仅增加了模型的复杂度,而且不一定能显著提高预测精度。在特征选择过程中,合理筛选最具代表性的特征是提升模型性能的关键步骤,而过多的冗余特征则可能导致过拟合,降低模型的泛化能力。对于超参数优化,不同的参数组合对模型性能产生重要影响,优化的目标是通过精确调整这些关键参数,提升模型的适应性和泛化能力。然而,传统的超参数优化方法往往依赖人工调整,容易受到主观偏见的影响,操作繁琐且效率低下,且未能实现特征选择与超参数优化之间的有效协同,从而未能充分发挥模型的预测潜力。

为了应对上述挑战,本文收集了多种影响RDR的因素,并提出了基于IVY算法的KAN特征选择与参数优化预测框架(IVY-FSPOKAN)。该框架主要包含四个关键任务:(1)特征构建。本文整合了DDPSOC、交通状况、驾驶行为和车辆参数等数据,构建了一个用于RDR预测的稳健数据集。(2)特征选择。鉴于不同特征组合对RDR预测结果的重要影响,以及提升模型可解释性的需求,本文采用IVY算法提高特征选择的效率,并将其与KAN结合,构建了一个多层次的预测框架。(3)参数优化。考虑到超参数对KAN拟合能力的显著影响,本文应用IVY算法优化这些超参数,找到最适合所选特征的参数组合,从而提升预测框架的准确性。(4)模型验证。为了验证所提出预测框架的有效性,本文使用了1月、4月、7月和11月的数据集进行实验,实验结果表明,该框架在估计电动汽车剩余续航里程方面表现出较高的准确性和稳定性。

本文的主要贡献如下:首先,提升预测模型的可解释性。现有研究显示,使用决策树(DT)、XGBoost和LightGBM等方法构建的RDR预测模型往往存在预测结果可解释性差的问题。本文创新性地采用了KAN作为主要的预测方法,该方法不仅具备神经网络的非线性拟合能力,还能够有效量化各种影响因素,从而增强模型的透明度和可解释性。此外,本文是首次探索将KAN应用于提高RDR预测精度的研究。

其次,提出了一种融合特征选择与超参数优化的集成预测框架。为了克服当前RDR预测中“特征选择与超参数优化脱节”的核心瓶颈,本文提出了一种创新的“特征-超参数协同优化”框架,旨在深度耦合特征筛选与超参数调优的过程,而非将其作为独立的步骤进行处理。具体而言,IVY算法被用于在特征空间中进行随机筛选,有效减少冗余特征,从而提升输入数据的质量。同时,通过在超参数空间中进行系统搜索,IVY算法能够实现超参数与特征选择结果的最佳匹配,显著提高KAN模型的预测准确性和鲁棒性。这一协同优化机制不仅大幅提升了RDR预测的准确性,还显著降低了人工干预和试错的成本,为电动汽车的续航预测提供了一种高效且科学严谨的解决方案。

第三,通过多季节实验验证了预测框架的有效性。为了评估该框架的性能,本文选取了涵盖四季(春季、夏季、秋季和冬季)的四个月驾驶数据进行实验。实验结果表明,IVY-FSPOKAN预测框架在不同季节条件下均表现出稳健的预测准确性和稳定性,证明了其在实际应用中的广泛适用性。

最后,利用SHAP方法分析了所选特征的重要性。本文采用SHAP方法评估了所选特征组合(覆盖四个测试月份)对预测结果的贡献。分析结果表明,SOC和总电压是所有输入变量中最具影响力的两个特征。这一发现为模型优化提供了明确的方向,并有助于理解不同因素对RDR的具体影响。

本文的其余部分组织如下:第二章介绍了基于KAN的RDR预测框架设计,包括IVY算法的特征选择和参数优化机制,并讨论了KAN的基本原理和IVY优化算法。第三章则提供了对IVY-FSPOKAN预测框架的实证研究,包括数据收集与预处理、验证特征选择和参数优化对模型性能的影响,以及特征重要性的分析。最后一章总结了全文内容。

Kolmogorov-Arnold网络(KAN)是一种基于Kolmogorov-Arnold表示定理的创新神经网络架构。该定理指出,任何多元连续函数都可以通过有限个一元连续函数的组合进行近似。KAN的目标是通过构建特定结构的神经网络来实现这一函数近似。KAN的示意图如图1所示,在网络中,输入特征经过多层处理后,最终输出预测结果。KAN的优势在于其能够处理复杂的非线性关系,同时保持较高的可解释性,这使得它在RDR预测中具有独特价值。

在本文中,用于研究的数据来自国家新能源汽车大数据联盟(NDANEV),包含五辆相同型号电动汽车的2000多次实际驾驶数据,累计驾驶距离超过60万公里。原始数据涵盖了车辆速度、SOC、电池包电压、电池包电流、电机电压、电机电流、电池包最大和最小温度、行驶里程等多个维度。这些数据为构建RDR预测模型提供了坚实的基础。在数据预处理阶段,本文对原始数据进行了清洗、归一化和特征工程处理,以确保模型输入数据的质量和一致性。

在实验部分,本文首先分析了特征选择和参数优化对RDR预测准确性的具体影响。实验结果表明,合理的特征选择和精确的参数优化能够显著提升预测性能。随后,本文将IVY-FSPOKAN框架与13种常用机器学习算法进行了对比,结果显示该框架在三种评估指标上均优于其他方法,并且具有显著的统计差异。此外,通过SHAP方法对特征重要性进行了深入分析,揭示了SOC和总电压对RDR预测的主导作用,为模型优化提供了理论依据。

综上所述,本文提出的IVY-FSPOKAN预测框架在RDR预测中展现出良好的性能和实用性。通过结合IVY算法与KAN模型,该框架不仅提升了预测的准确性,还增强了模型的可解释性,为电动汽车的智能管理提供了新的思路和技术手段。未来的研究可以进一步探索更多影响因素,并优化模型的计算效率,以适应更复杂的驾驶环境和更大的数据规模。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号