美国增强型全国尺度城市树冠覆盖数据集:提升精度,助力城市生态研究

【字体: 时间:2025年03月25日 来源:Scientific Data 5.8

编辑推荐:

  为解决城市树冠覆盖(TCC)数据精度与时空覆盖问题,研究人员开展相关研究,得出增强型数据集,助力城市生态分析。

  在城市的生态画卷中,城市树木和森林犹如灵动的画笔,描绘着多样的生态景观,为城市居民带来诸多生态福利,比如缓解城市热岛效应、净化空气、调节雨水径流等。然而,要想精准评估这些生态系统服务,可靠的城市树冠覆盖(Tree Canopy Cover,TCC)数据至关重要。但目前的 TCC 数据却存在不少难题。
中等分辨率(30 米)的全国地图产品,像是美国国家土地覆盖数据库(National Land Cover Database,NLCD)的 TCC 数据,在呈现城市精细尺度的异质性方面有些力不从心。城市里土地覆盖类型复杂多样,30 米的分辨率很难捕捉到城市森林斑块的真实大小和形状,导致 TCC 数据的精度受限。而高分辨率(1 - 3 米或更精细)的数据虽然能更精准地反映城市树冠覆盖情况,可获取难度大,时空覆盖范围有限,而且不同来源的数据在生产方法、元数据、测量时间和土地覆盖分类标准上差异很大,缺乏统一规范。这就好比拼图缺少关键且合适的碎片,让研究人员、政策制定者和城市规划者在进行城市生态研究和规划时困难重重。

为了攻克这些难题,美国地质调查局(U.S. Geological Survey)等多个机构的研究人员携手合作 。他们的研究成果发表在《Scientific Data》上,旨在利用有限的高分辨率 TCC 数据、更广泛可用的中等分辨率 TCC 数据、辅助数据以及机器学习方法,大幅提升美国中等分辨率 TCC 数据的质量。

研究人员开展了一系列关键工作。在数据收集上,他们从美国环境保护署(EPA)的 EnviroAtlas 和佛蒙特大学(UVM)的空间分析实验室获取了 71 个美国城市地区的高分辨率土地覆盖数据,这些数据覆盖范围广泛,涵盖了不同规模的城市。同时,他们还收集了 14 个解释变量,包括 NLCD 的土地覆盖、不透水表面、树覆盖数据等结构数据,以及地表温度、归一化植被指数(Normalized Difference Vegetation Index,NDVI)等生物物理和气候数据。

在模型构建方面,研究人员运用随机森林模型(Random Forest Model),通过 Python 的‘sklearn’和‘statsmodels’软件包进行建模。为了优化模型,他们使用随机搜索和网格搜索交叉验证方法调整超参数,分配 70% 的数据用于训练,30% 用于测试。

经过一系列的研究,取得了诸多重要成果。

  • 模型性能优异:整体模型的决定系数(R2)达到 0.747,能较好地解释 TCC 的变化。与原生 NLCD TCC 数据集相比,新模型显著改善了 TCC 估计值,减少了误差。在单个城市层面,R2值在 0.292(凤凰城 - 梅萨,亚利桑那州)到 0.813(波特兰,缅因州)之间,多数城市的 R2值达到 0.6 及以上。而且,新模型的预测误差大幅降低,均方根误差(Root Mean Squared Error,RMSE)和平均绝对误差(Mean Absolute Error,MAE)表现都优于原生数据集,平均 RMSE 降低了 32%,MAE 降低了 31%。
  • 交叉验证稳定:通过 1000 折随机交叉验证、城市留一法交叉验证和按人口普查街区组建成年份中位数进行的交叉验证,结果表明模型具有较高的稳定性和泛化能力。例如,1000 折随机交叉验证的 R2值在 0.738 - 0.768 之间,均值为 0.753;城市留一法交叉验证的中位数 R2值为 0.675;人口普查街区组建成年份中位数留一法交叉验证的 R2值相对稳定,均值为 0.73。
  • 变量影响明确:研究发现,来自 NLCD 的 4 个时间动态解释变量和来自 Landsat 影像的 2 个变量(NDVI 和地表温度)是 TCC 的主要影响因素。建筑相关变量的重要性较低,去除这些变量对模型解释力影响较小,这意味着模型主要依赖可更新的变量,可用于生成增强型 TCC 数据的时间序列。

这些研究成果意义重大。增强型的 30 米分辨率城市 TCC 数据集,提升了美国城市地区 TCC 数据的精度和空间分布准确性,更准确地反映了 TCC 的变异性和模式,有助于深入理解城市森林结构。而且,该数据集可用于量化生态过程,评估城市森林的生态和社会经济重要性,为可持续城市规划和发展提供有力支持。同时,研究提供的模型代码,方便其他地区利用高分辨率和中等分辨率数据生成增强型城市 TCC 产品,推动全球城市生态研究的发展。

总的来说,这项研究成功解决了城市 TCC 数据存在的精度和时空覆盖问题,为城市生态研究和规划提供了关键的数据支持和方法借鉴。但研究也存在一些局限性,比如在预测树木覆盖极少的区域时,模型性能会受到影响。未来的研究可以进一步优化模型,提高其在特殊区域的预测能力,更好地服务于城市生态建设。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号