编辑推荐:
随着能源转型,电网面临挑战,机器学习(ML)可应对但缺数据。研究人员构建算法生成欧洲大陆电网功率注入合成数据集。该数据集真实、高质量,为 ML 应用提供支持,助力电网安全评估等研究。
在能源转型的浪潮之下,电力系统正经历着深刻变革。大量可再生能源如分布式电源、海上风电场、大型太阳能光伏电站以及电池储能设施接入电网,这一方面为可持续能源发展带来希望,另一方面却给电网运行带来诸多难题。电网运行愈发接近技术极限,且面临更频繁、剧烈的波动,传统评估电网安全性和可靠性的方法在计算上变得极具挑战。而机器学习(ML)方法虽被寄予厚望,却因严重依赖大量高质量训练和测试数据,在实际应用中受阻,因为获取真实电网的历史运行数据极为困难。在此背景下,开展生成高质量电网运行合成数据集的研究迫在眉睫。
瑞士应用科学与艺术大学西部校区(HES-SO)工程学院等机构的研究人员进行了深入探索。他们构建并描述了一种通用算法,用于生成不同规模电网的现实数据集,且该算法能适应不同的发电组合和消费模式。最终得到了一个包含欧洲大陆同步电网 20 年每小时数据的大型合成数据集,涵盖数千个负荷和数百个不同类型的发电机。这一成果意义重大,为后续电网时间序列异常检测等研究奠定了坚实基础,也为机器学习在电网领域的广泛应用提供了有力支持。相关研究成果发表在《Scientific Data》上。
研究人员在研究过程中主要运用了以下关键技术方法:首先,采用 PanTaGruEl 模型来描述欧洲输电网络,该模型包含线路导纳、发电机位置及容量等关键信息;其次,以 ENTSO-E 透明度平台数据为输入,包括各国负荷、核电站发电数据等;最后,通过优化算法求解最优潮流(OPF)问题,确定发电机的发电时间序列 ,并在求解过程中对模型和数据进行了一系列处理以确保结果的真实性和有效性。
下面具体来看研究结果:
- 合成负荷时间序列:研究人员利用 ENTSO-E 数据构建各国负荷统计分布,结合 PanTaGruEl 模型中的人口密度因子,通过在傅里叶(Fourier)空间添加噪声的方式,生成了具有现实统计特性的负荷时间序列。这些序列保留了真实数据的年、周、日调制特征,且与实际数据的相关性分布相符,例如瑞士电网合成数据与实际数据的皮尔逊(Pearson)相关系数分布高度一致。
- 发电调度算法:对于非核电站,研究人员将其视为可调度电源,通过制定包含所有时间步的 OPF 问题,并将线路热极限纳入目标函数,同时考虑发电机功率限制、爬坡率等约束条件,确定了发电机的输出。通过引入随机谐波噪声模拟发电成本变化,使生成的发电时间序列更符合实际运行模式,与实际数据相比,在不同时间尺度上均展现出良好的一致性 。
- 数据集验证:从多个方面对生成的数据集进行验证。在负荷方面,合成负荷曲线的特征与真实数据一致,且聚合后的总负荷与 ENTSO-E 数据匹配;在发电方面,无论是单个发电机还是按国家和类型聚合的发电数据,合成数据与实际数据在定性和定量上都高度相符,这表明该数据集能真实反映电网的运行情况。
研究结论表明,研究人员成功构建了一个大型、现实且高质量的欧洲大陆电网功率注入合成数据集,并开发了相应的生成算法。该数据集可用于多种电网相关研究,特别是为机器学习在电网中的应用提供了宝贵的数据支持。这不仅有助于解决当前电网运行评估面临的挑战,也为未来电网的智能化发展和安全稳定运行提供了重要的技术支撑。在未来研究中,可以基于该数据集进一步开展电网异常检测、故障诊断等方面的研究,推动电力系统领域的技术进步。