《Scientific Data》:Prolonged water body types dataset of urban agglomeration in central China from 1990 to 2021
编辑推荐:
为解决内陆水体时空动态数据有限问题,研究人员对长江中游城市群水体类型展开研究,构建高精准数据集,助力资源管理与湿地保护。
# 长江中游城市群水体类型研究:开启水资源管理新征程
在地球的生态大舞台上,内陆地表水体(Inland surface water bodies)无疑是至关重要的 “主角” 之一。它们不仅是农业灌溉的 “生命之源”、工业生产的 “动力引擎”,更是维系人类社会生存与发展的关键要素,从区域到全球,发挥着不可替代的作用。而且,内陆水体与可持续发展目标(SDG)中的多个目标紧密相连,如 SDG 6(清洁饮水和卫生设施)、SDG 14(水下生物)和 SDG 15(陆地生物) 。
不同类型的水体,像是奔腾不息的河流、波光粼粼的湖泊,以及人工修建的池塘等,对城市生态环境有着千差万别的影响。例如,用于农业和水产养殖的人工池塘,就像隐藏在大地上的 “碳排放小怪兽”,其碳排放量相对较高。大规模的人工水体聚集,如同给大地来了一场 “大变身”,会导致湖泊、河流和湿地的土地覆盖类型发生改变,进而影响整个生态系统的平衡。
尽管目前已经有不少不同空间分辨率的内陆地表水体测绘数据,用于水体监测,但这些数据大多是简单的 “水与非水” 二元地图,只能反映永久性和季节性地表水的月度或年度动态。在一些土地覆盖和湿地相关研究中,虽然开始尝试对水和湿地(季节性水)进行分类并探究其长期趋势,但由于不同类型地表水的光谱特征极为相似,就像一群 “伪装高手”,给区分它们带来了巨大挑战。以往基于各种形状参数的阈值分类方法,不仅在稳定特征提取上困难重重,还需要大量繁琐的人工后期处理工作,导致相关研究只能局限在少数城市和有限的年份,无法进行大规模、长期的测绘与分析。
为了突破这些困境,中国地质大学(武汉)的研究人员挺身而出,开展了一项意义非凡的研究。他们聚焦长江中游城市群(urban agglomeration in the middle reaches of the Yangtze River),利用深度学习技术,对 1990 - 2021 年该区域的多种水体类型进行了测绘,相关成果发表在《Scientific Data》上。
在研究过程中,研究人员主要运用了以下几种关键技术方法:
卫星影像数据 :选用谷歌地球引擎(GEE)上的 Landsat 系列卫星影像,包括 Landsat 5 专题制图仪(TM)、Landsat 7 增强型专题制图仪(ETM+)和 Landsat 8 陆地成像仪(OLI)的数据。这些影像来自 Landsat Collection 2 的 Tire 1 数据集,具有 30 米的空间分辨率,包含红、绿、蓝、近红外和两个短波红外波段,同时利用 QA 波段去除受云或云影影响的低质量观测数据。
语义分割数据集构建 :由于缺乏公开的多水体类型标注数据集,研究人员手动对 2020 年 Landsat 8 的中值合成影像进行标注。将影像裁剪成 512×512 像素的非重叠小块,基于全球地表水数据集(GSW_JRC)进行分层抽样,选取部分小块手动标注为湖泊、河流、湿地和人工水体四类,随后将数据集按 4:1 的比例划分为训练集和验证集。
深度学习模型 :采用基于视觉 Transformer 开发的 Segformer 模型作为骨干网络进行湿地测绘。通过构建语义到像素(Semantic-to-Pixel)框架和弱监督长期测绘框架,实现对多种水体类型的精准测绘。其中,弱监督框架利用教师 - 学生模型结构和指数移动平均(EMA)策略更新权重,并设计了包含监督交叉熵损失(L s ? )、无监督损失(L u ? )和水体损失(L w a t er ? )的损失函数来优化模型训练。
研究结果
数据集构建 :成功构建了 Water-MRYR 数据集,该数据集涵盖了长江中游城市群 1990 - 2021 年的水体类型长期测绘结果,空间分辨率达 30 米。数据集中包含 14 个产品,1990 - 2010 年每五年一个产品,2013 - 2021 年每年一个产品,文件均以.tif 格式存储,命名为 UA_MRYR_Year.tif 。
精度评估 :
样本点验证 :通过对七个参考年份约 14000 个验证点的评估,水体覆盖测绘的总体精度(OA)在 92.45% - 95.98% 之间,平均 OA 为 94.50%。湖泊和人工水体的精度均超过 90%,大多数河流和湿地的精度超过 80%。
公开验证集验证 :基于两个公开验证集评估,在全球土地覆盖测绘样本集中,研究产品(UA_MRYR_2015)的 OA 达到 98.91%;在全球湖泊和湿地数据库(GLWD)中,研究产品(UA_MRYR_2005)与 96.96% 的多边形语义一致,充分证明了产品的高精度。
统计层面验证 :对 2020 年的测绘产品进行城市层面的面积统计发现,近 20% 的水资源为人工水体,且其分布与区域渔业经济密切相关。人工水体面积与渔业总产值之间存在显著相关性,皮尔逊相关系数为 0.88***,斯皮尔曼相关系数为 0.83*** 。
与其他数据集对比 :与其他五种水相关数据集对比,研究产品在展示多种水体类型的空间信息方面表现最佳。在湿地分类上,EA_Wetland 虽分辨率高但区分多种水体能力有待提升;CWaM 在呈现部分水体类别时存在人工池塘噪声问题;GLC_FCS30D 和 ESA WorldCover 则将人工水体错误分类为农田和草地。与长期测绘产品对比,研究产品能清晰展示水体覆盖类型和洪湖周边人工水体的显著扩张,而其他产品存在信息缺失或错误分类的情况。
研究结论与意义
这项研究成果为水资源管理和湿地保护提供了强有力的数据支持。Water-MRYR 数据集的高时空分辨率和高精度,让政府和公众能够更清晰地了解长江中游城市群水体类型的时空分布和变化趋势,从而为水资源的合理规划、开发和保护提供科学依据。例如,在制定湿地保护政策时,可以根据数据集准确识别受人工水体扩张影响的湿地区域,及时采取保护措施。同时,研究揭示的人工水体与渔业经济的关系,也为区域经济发展和生态环境保护的协调提供了参考,助力实现可持续发展目标。研究人员利用深度学习技术成功构建的高精度水体类型数据集,为相关领域的研究开辟了新的道路,有望推动内陆水体研究向更深入、更广泛的方向发展。
閹垫捁绁�
娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴f洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀
10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�
濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�
閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞e崬鍙嗘禍鍡毿掓禒搴n儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�
娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�