电力系统实时故障检测与分类数据集:IEEE五节点案例研究
《Results in Engineering》:Real-Time Fault Detection and Classification Dataset for Power Systems: An IEEE 5-Bus Case Study
【字体:
大
中
小
】
时间:2025年09月30日
来源:Results in Engineering 7.9
编辑推荐:
电力系统故障实时检测专用数据集构建与机器学习模型验证。该数据集基于IEEE 5-bus系统,仅包含三相对电压(Va/Vb/Vc)和电流(Ia/Ib/Ic)关键参数,覆盖5类故障(单相/两相/三相接地/无故障)在7个位置的实测数据,显著降低计算复杂度。实验表明,决策树和k近邻模型在测试集上实现87.4%-87.7%的故障分类准确率,且具有最佳泛化能力。相较于现有数据集,本方案在实时性、参数精简度、故障覆盖广度方面具有明显优势。
在现代电力系统中,故障检测和分类是确保电网可靠运行的关键环节。随着电力系统复杂性的增加以及可再生能源的广泛接入,传统的故障检测方法在面对多样化的故障类型和实时性要求时面临诸多挑战。因此,构建一个既具备高准确率,又适用于实时分析的电力系统故障数据集成为一项重要的研究任务。本文提出了一种新型的集成数据集,专门用于电力系统传输线路的实时故障检测与分类。该数据集基于IEEE 5-bus系统,采集了关键节点的三相电压和电流数据,涵盖了五种常见故障类型,并在七个不同的故障位置进行了模拟。通过减少冗余特征并聚焦于核心参数,该数据集不仅提高了分类的准确性,还降低了计算负担,为电力系统故障识别提供了一个更加高效和实用的解决方案。
现有的电力系统数据集和方法往往存在两个主要问题:一是数据集过于复杂,包含大量与故障识别无关的参数,增加了计算资源的消耗;二是缺乏对实际故障场景的全面覆盖,难以满足实时监控的需求。本文所提出的解决方案通过简化数据采集过程,只保留与故障识别密切相关的三相电压和电流数据,从而在保持高准确率的同时,提高了数据集的实用性。此外,该数据集还具有良好的可扩展性,可以应用于更大规模的电力系统模型中,为未来的电网管理提供了坚实的基础。
数据集的构建基于MATLAB/Simulink平台,这一选择不仅因为其在电力系统建模方面的强大功能,还因为它提供了丰富的机器学习工具,使得数据集的生成和分析更加高效。在Simulink中,构建了一个标准的IEEE 5-bus系统,包括两个发电机和四个负载,系统中各节点的电压和频率均为230 kV和50/60 Hz。通过在不同节点之间注入故障,并对故障情况进行记录,最终生成了涵盖五种故障类型和七种故障位置的数据集。每个故障类型都被赋予了特定的数值标签,如DLG为0,LL为1,LLL为2,No Fault为3,SLG为4,TLG为5,以便于后续的机器学习模型训练和分类任务。
在数据集的性能评估中,采用了多种机器学习算法进行测试,包括决策树(DT)、高斯朴素贝叶斯(GNB)、K近邻(KNN)、多层感知机(MLP)和支持向量机(SVM)。同时,还测试了深度学习方法,如人工神经网络(ANN)和长短期记忆网络(LSTM)。结果表明,DT和KNN在该数据集上的表现最为出色,分别达到了87%以上的分类准确率。相比之下,其他模型如GNB、MLP和SVM在准确率方面表现较差,尤其是GNB几乎无法识别No Fault类别。这表明,对于这种数据集,基于简单特征的模型可能比复杂的深度学习模型更具优势。此外,虽然LSTM在Kaggle数据集上达到了100%的准确率,但在Simulink数据集上表现不佳,这可能是由于其对训练数据的过度依赖,导致泛化能力不足。
从数据集的结构和特征来看,三相电压和电流之间的相关性较强,而故障类型与其他参数之间则无明显相关性。这一特性使得模型在进行分类时能够更好地捕捉到故障的本质特征,而不受其他无关变量的影响。通过分析数据集的特征分布和模型性能,可以发现DT和KNN在处理该数据集时表现较为稳定,能够有效区分各种故障类型。然而,某些故障类型如LLL在所有模型中都表现出较高的误分类率,这提示我们需要进一步探索特征工程和模型优化的方法,以提高这些复杂故障类型的识别能力。
为了进一步提升模型的性能,本文还探讨了混合模型的应用。例如,结合Bi-LSTM和随机森林(RF)的混合模型在分类准确率上达到了78.82%,显示出良好的泛化能力和稳定性。这一结果表明,将深度学习的时序建模能力和传统机器学习的分类能力相结合,可以在电力系统故障识别中发挥更大的作用。此外,通过引入Bagging或Boosting等集成学习方法,可以增强模型的鲁棒性,提高其在不同故障类型和位置上的适应能力。
数据集的性能评估还涉及不同故障位置的分类结果。在Bus 1-2的故障位置上,DT和KNN的准确率均超过了87%,而其他模型如SVM和GNB则表现较差。这一结果表明,数据集的特征选择和故障位置的分布对于模型的性能具有重要影响。为了提升所有故障类型的识别效果,可以考虑采用更复杂的模型结构,如增加神经网络的层数、调整超参数或引入正则化技术。同时,通过特征增强和数据增强,如使用SMOTE算法对不平衡数据进行处理,或通过PCA降维减少冗余信息,可以进一步优化模型的性能。
此外,本文还比较了该数据集与多个公开数据集在实时性、故障分析能力、故障类型覆盖和传感器输入方面的优劣。与现有数据集相比,该数据集在实时性方面表现突出,适用于现代电力系统的快速响应需求。同时,它专注于电流和电压这两个核心参数,减少了传感器的数量,从而降低了硬件成本和数据采集复杂度。相比之下,许多公开数据集包含了更多的参数,如有功功率和无功功率,这虽然增加了数据的丰富性,但也提高了计算负担。
在实际应用中,该数据集具有较高的实用价值。它不仅适用于实验室环境下的研究,还可以用于电力系统的实际监控和保护策略制定。通过该数据集,电力工程师可以更好地理解故障发生的模式,并设计出更加有效的故障检测和分类方法。此外,该数据集还为未来研究提供了基础,例如在更大规模的电力系统(如IEEE 14-bus或21-bus系统)中进行故障分析和分类的探索。
总的来说,本文提出的电力系统故障数据集在简化数据采集、提高分类准确率和增强实用性方面取得了显著成果。它不仅填补了现有数据集在实时性和故障类型覆盖方面的不足,还为电力系统的故障检测和分类提供了新的思路。未来,随着电力系统规模的扩大和复杂性的增加,该数据集可以作为研究和应用的基础,进一步推动电力系统智能化和自动化的发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号