《Scientific Data》:An enhanced national-scale urban tree canopy cover dataset for the United States
编辑推荐:
为解决城市树冠覆盖(TCC)数据精度与时空覆盖问题,研究人员开展相关研究,得出增强型数据集,助力城市生态分析。
在城市的生态画卷中,城市树木和森林犹如灵动的画笔,描绘着多样的生态景观,为城市居民带来诸多生态福利,比如缓解城市热岛效应、净化空气、调节雨水径流等。然而,要想精准评估这些生态系统服务,可靠的城市树冠覆盖(Tree Canopy Cover,TCC)数据至关重要。但目前的 TCC 数据却存在不少难题。
中等分辨率(30 米)的全国地图产品,像是美国国家土地覆盖数据库(National Land Cover Database,NLCD)的 TCC 数据,在呈现城市精细尺度的异质性方面有些力不从心。城市里土地覆盖类型复杂多样,30 米的分辨率很难捕捉到城市森林斑块的真实大小和形状,导致 TCC 数据的精度受限。而高分辨率(1 - 3 米或更精细)的数据虽然能更精准地反映城市树冠覆盖情况,可获取难度大,时空覆盖范围有限,而且不同来源的数据在生产方法、元数据、测量时间和土地覆盖分类标准上差异很大,缺乏统一规范。这就好比拼图缺少关键且合适的碎片,让研究人员、政策制定者和城市规划者在进行城市生态研究和规划时困难重重。
为了攻克这些难题,美国地质调查局(U.S. Geological Survey)等多个机构的研究人员携手合作 。他们的研究成果发表在《Scientific Data》上,旨在利用有限的高分辨率 TCC 数据、更广泛可用的中等分辨率 TCC 数据、辅助数据以及机器学习方法,大幅提升美国中等分辨率 TCC 数据的质量。
研究人员开展了一系列关键工作。在数据收集上,他们从美国环境保护署(EPA)的 EnviroAtlas 和佛蒙特大学(UVM)的空间分析实验室获取了 71 个美国城市地区的高分辨率土地覆盖数据,这些数据覆盖范围广泛,涵盖了不同规模的城市。同时,他们还收集了 14 个解释变量,包括 NLCD 的土地覆盖、不透水表面、树覆盖数据等结构数据,以及地表温度、归一化植被指数(Normalized Difference Vegetation Index,NDVI)等生物物理和气候数据。
在模型构建方面,研究人员运用随机森林模型(Random Forest Model),通过 Python 的‘sklearn’和‘statsmodels’软件包进行建模。为了优化模型,他们使用随机搜索和网格搜索交叉验证方法调整超参数,分配 70% 的数据用于训练,30% 用于测试。
经过一系列的研究,取得了诸多重要成果。
- 模型性能优异:整体模型的决定系数(R2)达到 0.747,能较好地解释 TCC 的变化。与原生 NLCD TCC 数据集相比,新模型显著改善了 TCC 估计值,减少了误差。在单个城市层面,R2值在 0.292(凤凰城 - 梅萨,亚利桑那州)到 0.813(波特兰,缅因州)之间,多数城市的 R2值达到 0.6 及以上。而且,新模型的预测误差大幅降低,均方根误差(Root Mean Squared Error,RMSE)和平均绝对误差(Mean Absolute Error,MAE)表现都优于原生数据集,平均 RMSE 降低了 32%,MAE 降低了 31%。
- 交叉验证稳定:通过 1000 折随机交叉验证、城市留一法交叉验证和按人口普查街区组建成年份中位数进行的交叉验证,结果表明模型具有较高的稳定性和泛化能力。例如,1000 折随机交叉验证的 R2值在 0.738 - 0.768 之间,均值为 0.753;城市留一法交叉验证的中位数 R2值为 0.675;人口普查街区组建成年份中位数留一法交叉验证的 R2值相对稳定,均值为 0.73。
- 变量影响明确:研究发现,来自 NLCD 的 4 个时间动态解释变量和来自 Landsat 影像的 2 个变量(NDVI 和地表温度)是 TCC 的主要影响因素。建筑相关变量的重要性较低,去除这些变量对模型解释力影响较小,这意味着模型主要依赖可更新的变量,可用于生成增强型 TCC 数据的时间序列。
这些研究成果意义重大。增强型的 30 米分辨率城市 TCC 数据集,提升了美国城市地区 TCC 数据的精度和空间分布准确性,更准确地反映了 TCC 的变异性和模式,有助于深入理解城市森林结构。而且,该数据集可用于量化生态过程,评估城市森林的生态和社会经济重要性,为可持续城市规划和发展提供有力支持。同时,研究提供的模型代码,方便其他地区利用高分辨率和中等分辨率数据生成增强型城市 TCC 产品,推动全球城市生态研究的发展。
总的来说,这项研究成功解决了城市 TCC 数据存在的精度和时空覆盖问题,为城市生态研究和规划提供了关键的数据支持和方法借鉴。但研究也存在一些局限性,比如在预测树木覆盖极少的区域时,模型性能会受到影响。未来的研究可以进一步优化模型,提高其在特殊区域的预测能力,更好地服务于城市生态建设。
婵炴垶鎸搁鍫澝归崶鈹惧亾閻熼偊妲圭€规挸瀛╃€靛ジ鏁傞悙顒佹瘎闁诲孩绋掗崝鎺楀礉閻旂厧违濠电姴娲犻崑鎾愁潩瀹曞洨鐣虹紓鍌欑濡粓宕曢鍛浄闁挎繂鐗撳Ο瀣煙濞茶骞橀柕鍥ㄥ哺瀵剟骞嶉鐣屾殸闂佽偐鐡旈崹铏櫠閸ф顥堥柛鎾茬娴狀垶鏌曢崱妤婂剱閻㈩垱澹嗗Σ鎰板閻欌偓濞层倕霉閿濆棙绀嬮柍褜鍓氭穱铏规崲閸愨晝顩烽柨婵嗙墦濡鏌涢幒鎴烆棡闁诲氦濮ょ粚閬嶅礃椤撶姷顔掗梺璇″枔閸斿骸鈻撻幋锔藉殥妞ゆ牗绮岄埛鏍煕濞嗘劕鐏╂鐐叉喘閹秹寮崒妤佹櫃
10x Genomics闂佸搫鍊瑰姗€骞栭—娓媠ium HD 閻庢鍠掗崑鎾绘煕濮樼厧鐏犵€规洜鍠撶槐鎺楀幢濮橆剙濮冮梺鍛婂笒濡粍銇旈幖浣瑰仢闁搞儮鏅滈悾閬嶆煕韫囧濮€婵炴潙妫滈妵鎰板即閻樼數鐓佺紓浣告湰濡炶棄螞閸ф绀嗛柛鈩冡缚閳ь兛绮欓弫宥夋晸閿燂拷
濠电偛妫庨崹鑲╂崲鐎n偆鈻旈悗锝庡幗缁佺櫉wist闂侀潧妫楅敃锝囩箔婢舵劕妫樻い鎾跺仜缂嶄線鏌涢弽銊у⒈婵炲牊鍘ISPR缂備焦绋掗惄顖炲焵椤掆偓椤︿即鎮ч崫銉ゆ勃闁逞屽墴婵″鈧綆鍓氶弳鈺呮倵濞戞瑥濮冮柛鏃撴嫹
闂佸憡顨嗗ú婊呭垝韫囨稒鍤勯柣鎰嚟閵堟挳骞栭弶鎴犵闁告瑥妫濆濠氬Ω閵夛絼娴烽柣鐘辩劍瑜板啴鎮ラ敓锟� - 濠电儑绲藉畷顒勫矗閸℃ḿ顩查柛鈩冾嚧閹烘挾顩烽幖杈剧秵閸庢垵鈽夐幘顖氫壕婵炴垶鎼╂禍婊冪暦閻旇櫣纾奸柛鈩冭壘閸旀帡鎮楅崷顓炰槐闁绘稒鐟ч幏瀣箲閹伴潧鎮侀梺鍛婂笧婢ф寮抽悢鐓庣妞ゆ柨鐏濈粣娑㈡煙鐠ㄥ鍊婚悷銏ゆ煕濞嗘ê鐏ユい顐㈩儔瀹曠娀寮介顐e浮瀵悂鏁撻敓锟�
婵炴垶鎸搁鍫澝归崶顒€违濠电姴瀚惌搴ㄦ煠瀹曞洤浠滈柛鐐存尦閹藉倻鈧綆鍓氶銈夋偣閹扳晛濡虹紒銊у閹峰懎饪伴崘銊р偓濠氭煛鐎n偄濮堥柡宀€鍠庨埢鏃堝即閻樿櫕姣勯柣搴㈢⊕閸旀帡宕濋悢鐓幬ラ柨鐕傛嫹