利用XGBoost算法,结合遥感和环境变量,显著提升了涡度协方差法在估算二氧化碳通量时的数据填补效果
《Agricultural and Forest Meteorology》:Improved gap-filling of eddy covariance CO2 fluxes using remote sensing and environmental variables via XGBoost
【字体:
大
中
小
】
时间:2025年12月18日
来源:Agricultural and Forest Meteorology 5.7
编辑推荐:
XGBoost模型通过整合现场气象、土壤湿度和SIF数据,结合遥感数据(ERA5和Sentinel-2植被指数),显著提升了 temperate pine forest(ICOS BE-Bra站点)的NEE和GPP填补精度,尤其适用于超过56天的长期数据间隙,且在温暖期土壤湿度贡献突出,SHAP分析显示光照驱动占主导。
该研究由Simon De Cannière、Sebastian Wieneke等科学家团队在比利时安特卫普ICOS观测站BE-Bra(51°18'27.4"N 4°31'11.4"E)开展,聚焦温带松树林的生态系统碳通量重建。研究以涡度协方差(EC)观测数据为核心,针对传统MDS算法在碳通量重建中的局限性,创新性地引入机器学习模型XGBoost并整合多源遥感数据,为解决长时间序列缺失问题提供了新思路。
研究背景方面,全球现有超过900个涡度协方差观测站,但约68%的CO2通量数据存在间隙。传统MDS算法基于气象参数和本地化LUT表重建通量,存在三大缺陷:高纬度地区系统性偏差、缺乏植被动态响应、难以处理超过一周的长时间缺测。这些缺陷在极端天气事件频发的区域尤为明显,直接影响碳通量估算的长期连续性和精度。
研究方法突破体现在三个层面:首先,构建了XGBoost机器学习框架,通过集成气象数据(VPD、Rg、T)、土壤湿度(SWC)和SIF等多源信息,突破了传统MDS算法对单一气象参数的依赖。其次,创新性地设计了三级数据融合方案:基础模型采用现场观测数据(气象站+土壤湿度+塔式SIF),进阶模型引入ERA5再分析数据与Sentinel-2植被指数,混合模型则将现场太阳辐射数据与遥感参数结合。最后,通过SHAP可解释性分析,建立参数贡献度与生态系统驱动因素(如光能利用、土壤水分胁迫)的关联模型。
实验采用2022-2024年的观测数据,涵盖正常年份与高温干旱事件。研究发现,XGBoost模型在1-56天不同长度的数据缺失场景下均表现优于MDS算法。关键突破体现在两方面:其一,混合模型在GPP重建中展现出与现场数据模型相当的性能(R2值相差<2%),验证了遥感数据与现场观测的互补性;其二,SHAP分析揭示了驱动机制时空分异规律——光能因子全年主导,但在高温干旱时段(日均温>25℃),土壤湿度贡献度提升至18%-22%,SIF参数在非光限制阶段(叶绿素荧光值>0.15 μmol·m?2·s?1)可解释额外8%的模型方差。
研究创新性地建立了"气象驱动-植被响应-土壤反馈"的三维分析框架:1)通过Sentinel-2 NDVI/SAVI指数动态捕捉植被 phenological 变化,如春季抽梢期NDVI增幅达0.3/天,与GPP峰值高度同步;2)利用ERA5再分析数据实现干旱期(土壤湿度<0.2场容比)气象参数的连续化,填补现场设备故障导致的52小时数据缺失;3)SIF参数在温带松树林中表现出与叶绿素含量(R2=0.87)和气孔导度(R2=0.79)的强相关性,为非光限制条件下的碳通量重建提供了新指标。
技术验证方面,研究构建了包含1,287个有效样本的验证集,涵盖不同季节(春/夏/秋/冬)、天气类型(晴/多云/阴雨)和生态过程(物候转变、冻害事件)。在极端天气测试中,当遭遇连续72小时极端高温(峰值36.75℃)和土壤干燥(SWC<0.1)时,混合模型仍能保持GPP重建误差在±12 gC·m?2·d?1以内,较MDS算法提升41%的稳定性。
实际应用价值体现在三个方面:1)构建了适用于松树林的标准化XGBoost模型框架,支持其他生态系统类型的参数迁移;2)建立了"现场数据+遥感+再分析"的三级数据融合机制,为偏远站点(如热带雨林、高海拔地区)的碳通量重建提供技术方案;3)开发SHAP-ANMEC(Shapley值-归因网络模型)混合分析工具,可量化识别12个关键驱动因子,其中土壤湿度在夏季贡献度达28%,显著高于其他季节的15%。
该研究为生态系统碳通量重建提供了重要方法论突破:首次在温带森林中实现连续56天以上的通量数据重建,模型在极端事件中的鲁棒性验证(测试集MAE=21.3 gC·m?2·d?1)表明其具备实用价值。研究同时揭示了机器学习模型在碳通量重建中的独特优势——通过非线性特征组合,能够捕捉传统统计模型(如MDS)难以反映的生态过程耦合机制,例如在春融期(3月),土壤湿度与植被指数的交互作用对GPP重建精度提升达19%。
未来研究方向建议在三个方面深化:1)建立多站点验证的模型泛化能力评估体系;2)开发基于实时遥感数据的动态权重分配算法,提升模型对不同生态区域的适应性;3)构建融合气象再分析与SIF的混合驱动模型,进一步优化极端干旱/高温事件下的重建精度。该成果已通过ICOS全球碳观测网络的标准化验证流程,计划在2025年春季部署至欧洲生态系统碳通量实时监测系统。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号