编辑推荐:
为解决当前土地覆盖产品在黄土高原(CLP)地区空间识别精度不足,难以捕捉耕地、森林和草地真实变化的问题,研究人员生成了 1990 - 2022 年 CLP 地区 30 米年度土地覆盖数据集(YRCC_LPLC)。结果显示其总体精度达 85.16% ,能精准捕捉土地覆盖变化,对相关研究意义重大。
在地球系统中,土地覆盖是连接生物圈、大气圈和水圈的关键环节,对模拟地表过程、参与生态和水文模型运算起着基础性作用。然而,随着人类活动加剧,土地覆盖变化频繁,这对全球的水循环、空气质量、能量平衡、生物地球化学循环以及生物多样性都产生了深远影响。获取长期、精确且连续的土地覆盖数据,成为洞悉气候与环境动态变化、探究人类活动与全球变化相互作用机制的关键所在。
中国在经济飞速发展的进程中,面临着诸多严峻的环境挑战,如沙漠化、沙尘暴、水土流失和土地退化等问题。地处中国西北部的黄土高原,总面积约 6.4 万平方千米,属于典型的干旱半干旱地区。这里年降水量在 300 - 600 毫米之间,年平均气温为 4°C - 14°C ,水资源短缺严重制约着当地社会经济发展和生态建设。长期以来,气候变化和过度开垦使得黄土高原生态退化、水土流失问题极为严重,进而引发了黄河泥沙淤积等一系列社会经济难题。
为了改善黄土高原的生态环境,中国政府积极推行了多项生态修复工程,像 “三北” 防护林工程(TNSP)和退耕还林还草工程(GTGP)。自 1999 年 GTGP 实施以来,黄土高原的土地覆盖和利用状况发生了显著变化,尤其是在黄土丘陵沟壑区,耕地面积明显减少,森林和草地面积大幅增加。而且,有研究表明,黄土高原的土地覆盖变化对黄河流域的径流和泥沙减少贡献显著,因此,精确评估植被类型变化对水土流失的影响,成为该领域的研究热点。
在此背景下,土地覆盖数据成为解释黄土高原支流径流和泥沙减少原因、评估植被恢复生态效益的重要依据。但现有的常用土地覆盖产品,如欧洲空间局气候变化倡议(ESA - CCI)土地覆盖产品(300 米)、MCD12Q1 产品(500 米)、马里兰大学(UMD)土地覆盖图(1 千米)等,空间分辨率较低,难以捕捉黄土高原因地形破碎导致的复杂土地覆盖分布情况。虽然高分辨率地球观测(EO)数据推动了 30 米及更高分辨率产品的发展,像 Finer Resolution Observation and Monitoring of Global Land Cover 产品(FROM - GLC)、GlobeLand30、年度中国土地覆盖数据集(CLCD)、Global land - cover product with fine classification(GLC_FCS30)等,但这些产品在分类和变化检测精度上仍存在不足,严重影响了对黄土高原生态水文过程响应机制的研究,也限制了黄河流域洪水和泥沙模拟预测的准确性。
为了攻克这些难题,黄河水利委员会(YRCC)的研究人员开展了相关研究,生成了 1990 - 2022 年黄土高原土地覆盖(YRCC - LPLC)年度数据集。该研究具有重要意义,其成果发表在《Scientific Data》上,为黄土高原生态环境研究和黄河流域生态保护提供了关键的数据支持。
研究人员在这项研究中运用了多种关键技术方法。在数据获取方面,从 Google Earth Engine(GEE)平台收集 Landsat 5、7、8 的表面反射率(SR)时间序列数据,并利用 CF - mask 算法去除云及云影污染的像素;同时使用 ALOS Global Digital Surface Model “ALOS World 3D - 30m(AW3D30)” 作为数字高程模型(DEM)来提取地形特征。在分类方法上,采用随机森林(RF)分类器,结合光谱特征、地形特征以及多种植被指数,对土地覆盖类型进行分层分类。最后,通过独立测试样本和混淆矩阵对分类结果进行精度评估,并与其他土地覆盖产品进行对比分析。
下面详细介绍研究结果:
- 土地覆盖分类及样本收集:研究旨在生成 YRCC - LPLC 数据集,为此构建了一套综合处理流程,包括训练和测试样本的生成、不同土地覆盖类型输入特征的开发、RF 分类模型的构建、时空一致性验证以及精度评估,并与其他土地覆盖产品进行对比。在样本收集时,参考 CLCD,结合高分辨率影像和 GEE,采用视觉解译和自动样本提取的方法,最终确定了 17448 个样本,并按 7:3 的比例划分为训练样本和测试样本。
- 分类输入特征:分类输入特征源自光谱特征和地形特征。研究人员计算了各光谱波段的 50<sup>th</sup>百分位数、多种植被指数(如 NDVI、NDMI、NDTI、NBR、EVI)的 50<sup>th</sup>百分位数、年度最大 NDVI(NDVI<sub>max</sub>)及其对应光谱波段的反射率、NDVI 和 NBR 的标准差等。同时,考虑到地形对植被分布的影响,将 DEM、坡度、坡向、地形湿度指数(TWI)和光照局部角度(Cosi)等地形特征也纳入输入特征,以提升分类精度。
- 分类及后处理:为最大程度降低分类误差,研究采用分层分类策略,利用 RF 分类器对黄土高原陆地进行分类。首先从 CLCD 中识别出陆地,然后依据五月的 NDVI<sub>max</sub>及其对应反射率、年度 NDVI<sub>max</sub>及其对应反射率和地形特征,对森林 / 草地、耕地和非植被进行分类,最后再进一步细分森林、灌木、草地、裸地和不透水地表。分类完成后,运用空间滤波和时间逻辑推理等后处理手段,对 YRCC - LPLC 数据进行优化。
- 精度评估:研究使用 5234 个测试样本,通过混淆矩阵评估 YRCC - LPLC 的精度,计算出生产者精度(PA)、用户精度(UA)、总体精度(OA)、Kappa 系数和 F1 分数等指标,并与其他 5 种土地覆盖产品进行对比。结果显示,YRCC - LPLC 的 OA 为 85.16% ,显著优于其他产品。其中,耕地的平均 F1 分数最高,达 90.39% ,草地为 86.91% ,裸地和不透水地表的 F1 分数也较高。
- 与其他土地覆盖产品的比较:在空间分布方面,对比不同产品在四个区域的表现发现,MCD12Q1 无法捕捉土地覆盖的空间异质性,ESACCI 存在明显分类错误,而 YRCC - LPLC 在分类精度和反映土地覆盖多样性上表现出色。在耕地分类的对比中,YRCC - LPLC 能更准确地描绘耕地的空间变化。在时间变化方面,分析 1990 - 2022 年不同土地覆盖类型的面积动态变化可知,YRCC - LPLC 中耕地、草地和裸地的变化比其他产品更显著,能更准确地反映因 GTGP 和水土保持工作导致的土地覆盖变化。在检测土地覆盖变化时间上,YRCC - LPLC 检测出的耕地转为森林和草地的变化年份主要集中在 1998 - 2005 年,与 GTGP 实施时间相符,而 CLCD 的检测结果与实际情况不符。
综合研究结果和讨论部分,YRCC - LPLC 数据集在精度和捕捉土地覆盖变化方面具有显著优势。它不仅能准确呈现黄土高原土地覆盖的空间分布,还能精确捕捉土地覆盖的变化方向和时间,尤其是对耕地向森林和草地的转换这一关键变化的监测效果突出。这一数据集为研究黄土高原生态系统变化、评估生态修复工程效果、模拟水文和生态过程提供了高精度的数据支持,有助于深入理解黄土高原生态环境演变机制,为区域生态保护和可持续发展决策提供科学依据 。