考虑多运行条件的可再生能源发电设备数据驱动建模中的阻抗数据集优化方法

《Journal of Modern Power Systems and Clean Energy》:Impedance Dataset Optimization Method for Data-Driven Modeling of Renewable Power Generation Equipment Considering Multi-Operation Conditions

【字体: 时间:2025年11月19日 来源:Journal of Modern Power Systems and Clean Energy 6.1

编辑推荐:

  本文针对可再生能源发电设备(RPGE)在多运行条件下的阻抗建模问题,提出了一种阻抗数据集优化方法。由于RPGE的黑箱特性,传统数据驱动建模存在数据集质量低、冗余大的问题。研究人员通过评估运行点对阻抗的影响、优化频率分布设计以及串行更新数据集与模型,显著提升了数据质量,在减少数据量的同时准确反映了阻抗特性。基于控制硬件在环(CHIL)的实验验证了该方法的有效性,为RPGE的稳定分析提供了高效建模方案。

  
随着可再生能源渗透率的不断提高,其在带来显著经济和环境效益的同时,也引发了诸如次/超同步振荡等电网不稳定问题。阻抗稳定性分析方法是评估可再生能源发电设备(RPGE)与电网互联系统稳定裕度的关键手段。然而,由于商业保密性,大多数RPGE的内部参数和控制结构并不公开,这给基于数学公式的阻抗模型建立带来了巨大困难。在此背景下,基于小信号注入的阻抗测量成为黑箱条件下更有效的阻抗建模途径。但传统阻抗测量通常在固定运行点下进行,当实际运行条件变化时,测量结果难以适用于互联系统的稳定性分析。为了分析多运行条件下的系统稳定性,获取多运行阻抗模型变得至关重要。近年来,人工智能(AI)和数据驱动方法在阻抗建模领域得到了广泛发展。通常,为了尽可能涵盖阻抗特征,数据集的构建会采用极小的运行点和频率间隔,这导致数据集庞大,包含数百万测量数据。然而,实际阻抗测量非常耗时,且可获取的测量数据有限。因此,如何在保证模型精度的前提下,减少所需数据量,提高数据质量,成为当前研究的关键挑战。
为解决上述问题,研究人员开展了一项主题为“考虑多运行条件的可再生能源发电设备数据驱动建模中的阻抗数据集优化方法”的研究。该研究旨在提升阻抗测量数据集的质量,从而以更少的数据量反映整体的阻抗特性。论文发表在《Journal of Modern Power Systems and Clean Energy》上。
为开展研究,研究人员主要应用了几项关键技术。首先,利用随机森林(RF)算法评估不同运行点(如d轴电流Id、q轴电流Iq、d轴电压Ud)对阻抗(如Y11, Y12, Y21, Y22)的特征重要性,以优化运行点的选择。其次,在每个选定的运行点,采用高斯过程回归(GPR)预测阻抗曲线趋势,并计算不确定性指标,以优化测量频率的分布,使其在阻抗变化剧烈的频段(如谐振点附近)更为密集。接着,提出了一种数据集与多运行阻抗模型的串行更新方法,通过迭代过程不断细化数据集。最后,基于控制硬件在环(CHIL)实验平台,以一台1.5 MW的网侧变流器(VSC)为被测对象,进行阻抗测量和模型验证,所有数据均来自该实验平台。
研究结果部分通过多个小节展示了具体发现。
在“运行点对阻抗的影响”方面,研究通过分析不同运行条件下的阻抗特性(例如,改变Iq时Y11的幅值变化显著,而改变Ud时影响较小),证实了不同运行变量对阻抗的影响存在差异。
利用随机森林算法计算特征重要性,结果显示Iq对阻抗特性的影响最大,而Ud的影响最小,这与阻抗特性分析结果一致。
这为优化选择运行点提供了数据支持。
在“基于数据分析的运行点选择”中,研究通过计算运行点的总特征重要性(FI(Op) = FI(Id) + FI(Iq) + FI(Ud)),并采用优化算法搜索具有最大特征重要性的运行点,从而实现了在较少数据量下全面涵盖阻抗特征的目标。
在“阻抗测量中的频率设计过程”部分,研究指出宽带阻抗/导纳的获取需要在RPGE稳定运行条件下多次注入频率扰动信号。为了在整个频率范围内有效分布测量点,研究采用高斯过程回归(GPR)来预测导纳曲线的趋势。
通过计算不确定性指标(如ρMag(f) = δA2(f) / (Cn Mag mA(f*))),识别出拟合结果最不准确的频点,这些点通常对应导纳曲线的峰值和谷值等变化剧烈的区域。
据此选择下一次测量的频率,并通过迭代过程(如比较测量值与拟合值的误差是否小于设定阈值DA和DP)来确保阻抗变化特性被准确识别。阈值DA和DP则通过分析测量中信号噪声比(SNR)引起的最大幅值误差(ΔA11max)和最大相位误差(ΔP11max)来确定。
在“数据集和FNN模型的串行更新方法的实现”中,研究构建了一个多层前馈神经网络(FNN)作为多运行阻抗模型,其输入为Ud, Id, Iq和频率f,输出为导纳矩阵各元素的幅值和相位。
随后,提出了一个串行更新流程:首先确定初始测量数据集;然后训练FNN模型并评估其性能(训练损失和验证损失);若模型未达到预设目标(如均方误差(MSE)目标为1×10-6,验证损失与训练损失之比阈值ε为1.5),则通过优化运行点和频率设计来扩展数据集;最后重新训练模型,直至满足目标。该方法能适应不同的运行阻抗模型,并以较少数据量实现模型的准确建立。
在“实验验证”部分,研究基于控制硬件在环(CHIL)平台,以1.5 MW网侧变流器(VSC)为对象进行实验。
结果表明,所提出的方法能有效选择特征重要性高的运行点(如(0.21, 0.34, 0.99)点总特征重要性为25.96)
,并在阻抗变化剧烈的频段(如20-100 Hz)密集分布测量点。最终生成的优化数据集A(包含77个运行点,1540个阻抗数据)
,其训练出的FNN模型性能优异(训练损失3.95×10-7,损失比1.47)
。通过核密度估计(KDE)分析,数据集A的特征分布与包含海量数据的数据集B基本一致,证明其能以较少数据量准确反映实际阻抗特性。
在测试条件下,模型预测导纳与实际值的误差很小(Y11幅值误差最大不超过0.3 dB,相位误差小于1°)
,幅值和相位的均方根误差(RMSE)均处于较低水平。与采用均匀分布数据集的现有方法相比,所提方法生成的数据集质量更高,在达到相近预测精度时,所需数据量仅为现有方法的一半(数据集A 1540个数据 vs 数据集D 3000个数据),有效避免了模型过拟合,显著提升了数据效率。
归纳研究结论和讨论部分,本研究提出的阻抗数据集优化方法,通过评估运行点对阻抗的特征重要性、利用高斯过程回归(GPR)指导频率分布设计以及串行更新数据集与模型,显著提升了数据驱动建模中数据集的质量。实验证明,该方法能生成高代表性的数据集,以远少于传统方法的数据量,使训练出的前馈神经网络(FNN)模型准确预测可再生能源发电设备(RPGE)在多运行条件下的阻抗特性。这项工作为解决RPGE黑箱阻抗建模中的数据冗余和测量效率低下问题提供了有效方案,有力促进了数据驱动方法在实际阻抗获取场景中的应用,对保障高比例可再生能源接入下电网的稳定运行具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号