2022年德国与西班牙市政终端用能部门能耗与排放的时空解构数据集

《Scientific Data》:Disaggregated Municipal Energy Consumption and Emissions in End-use Sectors in Germany and Spain for 2022

【字体: 时间:2025年10月02日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对市政层面分部门能源消费和温室气体排放数据缺失的问题,开发了一种基于开放数据的空间解构方法,对2022年德国和西班牙的国家级最终能源消费和排放数据进行市政级分解。研究覆盖工业、交通、农业、家庭和商业五大终端用能部门,并利用XGBoost进行缺失值插补,通过逐步解构方法生成高分辨率数据集,为地方气候行动规划和政策制定提供了重要数据支撑。

  
在应对气候变化的全球行动中,地方层面的精准施策至关重要。然而,一个长期存在的瓶颈是缺乏高分辨率的能源消费和温室气体排放数据。虽然一些大城市能够自下而上地编制清单,但大多数中小城市缺乏这样的能力。现有研究通常通过空间解构国家总量数据来估算,但至今没有数据集能在市政层面同时提供多个部门的能耗和排放数据。这一数据缺口严重制约了地方气候行动的有效规划和评估。
为了填补这一空白,由德国于利希研究中心系统分析研究所的Shruthi Patil、Noah Pflugradt、Jann M. Weinand、于利希系统分析研究所-亚琛工业大学燃料电池主席的Detlef Stolten,以及波茨坦大学与波茨坦气候影响研究所的Jürgen Kropp组成的研究团队,在《Scientific Data》上发表了题为“Disaggregated Municipal Energy Consumption and Emissions in End-use Sectors in Germany and Spain for 2022”的研究论文。该研究开发了一套创新的方法,将2022年德国和西班牙的国家级最终能源消费和温室气体排放数据,解构到了市政级别。
研究人员面临两大主要挑战:市政级代理数据的有限性,以及代理数据集中普遍存在的缺失值。他们应用XGBoost(一种机器学习算法)进行数据插补,并采用基于区域统计数据的逐步解构策略。研究仅使用开放数据,确保了方法的可复现性,并为所有估算值分配了置信度评级,以支持数据的透明化解读。
研究方法主要包括四个步骤:数据收集、缺失值插补、逐步空间解构以及数据验证。数据来源包括Eurostat提供的国家级最终能源消费和温室气体排放数据,以及从Eurostat、Corine Land Cover、OpenStreetMap等多个公开数据库获取的代理数据。这些代理数据涵盖了人口、土地利用、交通网络、工业区位、建筑存量等多个维度,并在不同的空间层级(如NUTS2、NUTS3和LAU)进行收集和处理。
对于存在缺失值的代理数据,研究采用XGBoost模型进行插补。模型性能通过预留验证集和跨国家预测进行评估,并根据R平方得分将插补值的置信度划分为VERY HIGH, HIGH, MEDIUM, LOW, VERY LOW五个等级。空间解构则采用基于代理数据的方法,将国家级总量按照选定的空间代理变量(如人口、工业用地面积、道路网络长度等)的比例分配至各个市政单位。
数据收集与处理
研究收集了三类数据:各类子部门的最终能源消费数据、温室气体排放数据以及用于解构的相关代理数据。FEC和排放数据在国家层面获取,而代理数据则在不同的次国家级空间分辨率上收集。研究区域遵循欧盟的NUTS(Nomenclature of Territorial Units for Statistics)空间层级体系,市政级别对应LAU(Local Administrative Units)。
缺失值插补
针对代理数据中的缺失值,研究使用XGBoost模型进行预测插补。通过相关性分析筛选预测变量,并采用网格搜索和5折交叉验证进行超参数调优,以最小化均方根误差。插补值的质量通过R平方分数进行评估,并赋予相应的置信度等级。
逐步空间解构
由于许多代理数据并非直接可用於市政层级,研究采用逐步解构的方法。首先将NUTS3层级的代理数据使用LAU层级的代理数据进行解构,以获得更精细的代理变量;接着,利用LAU数据和已解构的NUTS3数据,将NUTS2层级的代理数据解构至LAU层级;最后,使用这些最终的LAU层级代理数据,将国家级FEC和排放数据解构到各个市政单位。代理变量的选择基于其与目标数据的理论相关性,并考虑了数据的可获取性。
数据记录与可用性
生成的数据集提供了2022年德国和西班牙在市政/LAU级别的、按部门详细划分的最终能源消费和温室气体排放数据。数据集保存在Zenodo平台,包含多个CSV文件,每个文件对应一个子部门的数据。数据列包括地区代码、数值以及数值置信度等级。FEC值以兆瓦时为单位,排放值以百万吨为单位。
技术验证
研究的验证面临市政级官方数据缺失的挑战。技术验证通过三种途径进行:与部分西班牙城市自下而上编制的清单进行对比;与另一空间解构数据集EDGAR进行交叉验证;以及对缺乏直接参考数据的部门进行空间分布模式的视觉评估。
与城市清单的对比显示,在建筑部门(包含家庭和商业),大多数城市的最终能源消费偏差绝对值低于20%。较大的偏差往往源于报告范围的不一致(如仅报告城市核心区而非整个NUTS3区域,或仅包含部分能源品种)。排放值的偏差通常大于能耗值,这归因于国家和地区间能源结构的差异。与EDGAR数据集的交叉验证表明,在国家层面,交通部门的偏差较小,但在区域层面存在显著差异,这反映了不同解构方法和代理变量选择的影响。
研究结论与意义
本研究成功创建了2022年德国和西班牙市政级别的、部门详细的最终能源消费和温室气体排放数据集。该工作主要创新点在于解决了市政层级相关空间代理数据有限的问题,并通过使用XGBoost插补和逐步解构方法,仅依赖开放数据生成了高质量、可复现的数据集。
研究成果具有重要的实践意义。它为市政当局满足清单编制和报告要求提供了宝贵资源,特别是对于那些统计基础设施或技术能力有限的地方政府。由于生成的数据集在各市政单位间方法一致,它们支持有意义的比较,从而为地方政策制定、资源分配以及市政战略与国家气候目标的协调一致提供信息。例如,道路交通的能耗数据可以支持电动汽车充电基础设施的规划,促进向电动交通的转型并评估其对电网负荷的影响。
然而,研究也存在一些局限性,包括某些部门代理数据的适用性有限、缺失值插补在某些情况下的不确定性、验证数据的覆盖范围不足以及仅针对单一年份(2022年)等。未来的研究可以随着市政级数据的丰富和更多自下而上清单的获取,进一步改进数据的准确性和稳健性。
总体而言,这项研究为在市政尺度上进行精细化的能源和气候分析提供了全面基础,推动了地方化气候行动的数据支撑能力建设。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号