DeepExtremeCubes:解锁复合热浪与干旱影响评估的地球系统时空数据宝藏

【字体: 时间:2025年01月26日 来源:Scientific Data 5.8

编辑推荐:

  随着气候极端事件频发,为解决现有数据难以分析复合热浪和干旱(CHD)极端影响的问题,研究人员开展了 DeepExtremeCubes 数据库相关研究。该数据库含 4 万多个全球采样小数据立方体,能助力预测 CHD 对陆地生态系统的影响,提升预测准确性。

  在全球气候不断变化的大背景下,气候极端事件正以前所未有的频率和强度出现。就像 2018 年,欧洲中部和北部遭遇的那场破纪录的复合热浪和干旱(CHD)事件,农业、森林、水资源供应以及社会经济等多个领域都深受其害 。面对日益严峻的形势,深入了解 CHD 事件的复杂动态,以及它们与气候驱动因素、空间条件、时间变化和陆地生态系统之间的相互作用,变得至关重要。
然而,在这个地球观测数据呈指数级增长的时代,数据管理和分析却面临着巨大挑战。尽管这些数据对理解气候极端事件的影响意义重大,但数据的复杂性却给机器学习模型的有效性带来了难题。同时,机器学习虽在气候科学研究中展现出潜力,但用于极端影响预测时,样本量较小,限制了其应用 。并且,现有的地球观测数据库大多是多用途的,没有专门针对 CHD 极端事件影响的数据集。为了填补这一空白,来自德国莱比锡大学、马克斯?普朗克生物地球化学研究所等多个研究机构的研究人员,共同开展了关于 DeepExtremeCubes 数据库的研究 。该研究成果发表在《Scientific Data》上,为评估 CHD 对陆地生态系统的影响提供了有力支持,有助于更精准地预测相关影响,提升应对气候变化的能力。

研究人员采用了多种关键技术方法。首先,利用已有的 Dry and hot extreme events database(Dheed 数据集 )和欧洲空间局(ESA)气候变化倡议(CCI)土地覆盖图确定采样分层。然后,从多个数据源提取数据,包括 Sentinel - 2 L2A 图像、ERA5 - Land 变量、哥白尼数字高程模型(DEM)数据等,构建小数据立方体(minicube) 。在采样过程中,运用特定的空间采样策略,从受 CHD 极端事件影响的区域及其周边采样,并考虑土地覆盖类型和纯度,生成了包含多种数据模态的 minicube 。最后,通过空间分析和与全球土地覆盖对比等方式对数据集进行验证。

数据来源及生成


研究使用两类输入数据源创建 DeepExtremeCubes。参考数据集用于确定分层,其中 Dheed 数据集通过每日聚合的 ERA5 再分析数据标注 CHD 事件,利用 2 米处最高日温度(Tmax)检测热浪,通过 30、90 和 180 天平均的降水与蒸发散差(PE30、PE90、PE180)检测干旱 。ESA CCI 土地覆盖图则利用多种卫星数据生成全球年度土地利用图,为采样提供土地覆盖信息 。每个 minicube 除包含 Dheed 数据集和 CCI 土地覆盖图的子集外,还涵盖 Sentinel - 2 MSI 表面反射率时间序列数据、基于深度学习的云掩模、ERA5 - Land 气象再分析变量以及 Copernicus DEM 数据 。通过这些多源数据,研究人员能够从多个维度研究 CHD 极端事件对植被的影响。

采样策略


为了让机器学习模型更好地学习 CHD 事件的影响,研究人员采用了独特的采样策略。先根据 Dheed 数据集生成 CHD 事件天数图,确定采样位置。从受极端事件影响的区域(“极端” 位置)和周边类似土地覆盖的区域(“非极端” 位置)采样,约 80% 的 “极端” minicube 位于受严重影响区域,20% 的 “非极端” minicube 位于 “极端” 区域附近且未经历 CHD 事件 。同时,研究人员重点关注了 6 种土地覆盖类型,包括阔叶树、针叶树、混交树、草地、裸地和城市区域,并根据土地覆盖纯度进一步筛选采样位置 。通过这种采样策略,既考虑了 CHD 事件的影响,又兼顾了土地覆盖类型和纯度,有助于提高模型预测的准确性。

数据验证


在数据验证方面,研究人员进行了土地覆盖代表性分析和空间分析。通过与全球土地覆盖对比发现,minicube 中阔叶树和针叶树的占比高于全球分布,混交树样本代表性不足,而草地和城市区域与全球分布比例相符 。空间分析结果显示,minicube 位置存在显著的正空间自相关,“极端” 和 “非极端” minicube 在空间上呈现聚类分布 。并且,研究还分析了 “极端” minicube 与相同土地覆盖的 “非极端” minicube 之间的距离和比例,发现不同土地覆盖类型在不同距离下的比例有所差异 。这些验证结果表明,该数据集在土地覆盖代表性和空间分布上具有一定的特点,为后续研究提供了有价值的信息。

研究结论与讨论


DeepExtremeCubes 数据集的构建为研究 CHD 极端事件对陆地生态系统的影响提供了重要的数据支持。通过独特的采样策略和多源数据融合,该数据集能够更全面地反映 CHD 事件的影响以及不同土地覆盖类型下的生态系统响应 。然而,研究也存在一定的局限性,例如数据集未充分涵盖受人为影响较大的土地覆盖类型,且用于采样的事件天数图可能并非最佳选择 。尽管如此,该研究成果仍具有重要意义。它为机器学习模型提供了高质量、结构良好的分析数据集,有助于提升对 CHD 极端事件影响的预测能力,为应对气候变化、保护陆地生态系统提供了有力的科学依据。未来研究可以在此基础上,进一步优化数据集,拓展研究范围,深入探究 CHD 事件与陆地生态系统之间的复杂关系。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号