在干旱地区,节水灌溉会导致土壤剖面中盐分积累的增加

《Soil and Tillage Research》:Enhancing soil salinity accumulation in the profile from water-saving irrigation in drylands

【字体: 时间:2025年11月06日 来源:Soil and Tillage Research 6.1

编辑推荐:

  土壤有机碳多源数据融合与机器学习预测模型研究,结合环境变量、光学遥感、SAR数据及SVM/RF/XGBoost算法,通过HASM数据融合优化,显著提升SOC预测精度(R2增4%-53%,RMSE降18%-25%),并修正空间分布偏差,为碳汇策略提供新方法。

  土壤有机碳(Soil Organic Carbon, SOC)作为全球陆地生态系统中最大的碳库,占据了总陆地碳储量的50%至80%。SOC的变化不仅直接影响大气中二氧化碳的浓度,从而对全球气候变化产生深远影响,还与作物生长和粮食安全密切相关。因此,精确地绘制SOC的空间分布图,对于制定有效的陆地碳汇策略具有重要意义。然而,目前在多源数据协同应用及其对模型估计精度的影响方面仍存在显著的研究空白,这一空白限制了对土壤碳库的准确评估。本研究提出了一种数据-模型融合框架,利用三种多源数据——环境变量、光学遥感数据和合成孔径雷达(SAR)数据,结合三种机器学习算法来预测SOC。我们通过高精度地表建模(High-Accuracy Surface Modeling, HASM)对SOC的实地观测数据和模型模拟数据进行了融合,结果表明,融合三种数据类型的组合与支持向量机(SVM)、随机森林(RF)和极端梯度提升(XGBoost)模型结合,能够显著提升预测精度,R2值提高了4%至53%,均方根误差(RMSE)则降低了18%至25%。此外,通过HASM数据融合,模拟的准确性也有了显著提升,R2值提高了18%至22%,RMSE降低了2%至12%。同时,SOC的空间分布模式也变得更加合理,对之前低估和高估的SOC含量进行了修正。这表明,多源数据融合与机器学习技术的结合可以实现SOC预测的最优结果,为全国乃至全球尺度的SOC估算提供了准确且新颖的方法,并为陆地碳汇的空间规划提供了科学指导。

SOC的估算方法通常包括实地调查、过程模型模拟和数据驱动的机器学习方法。实地调查虽然准确,但耗时、耗力,且不适用于大范围的空间扩展。过程模型在模拟和预测生态系统动态方面具有巨大潜力,但面临参数获取困难和复杂生态过程准确表征的挑战。相比之下,数据驱动的机器学习方法,尤其是结合多源遥感数据的方法,已成为SOC估算的有效替代方案。光学遥感技术在小范围的裸土区域已被广泛用于SOC的反演(Castaldi et al., 2019)。然而,在植被覆盖的区域,使用遥感技术进行土壤观测仍面临较大挑战。不过,植被与土壤之间的强相互作用,如植被对土壤生化过程的影响以及土壤特性对植被分布的制约作用(Ballabio et al., 2012),为利用光学遥感数据反演植被覆盖区的土壤特性提供了理论依据。例如,遥感植被指数和光谱特征波段(Garnier et al., 2022)已被成功应用于全球SOC数据集的生成,如SoilGrids(Hengl et al., 2017)和中国土壤信息网格数据集(Liu et al., 2022)。此外,微波遥感数据,特别是SAR数据,因其能够有效捕捉植被与土壤之间的关系而受到关注(Ceddia et al., 2017)。SAR数据已被用于中国黑河河流域SOC的估算(Zhou et al., 2020)。然而,我们的先前研究发现,在喀斯特地区,SAR数据并不适用于SOC的反演(Wang et al., 2023),这可能与这些地区复杂的地貌特征和高度的空间异质性有关。除了遥感数据,地形、气候、土壤类型、生物因素和人为活动等环境变量在SOC估算中也扮演了重要角色,因为它们对土壤形成过程具有显著影响(Tao et al., 2023)。

近年来,机器学习算法在SOC预测和制图中的应用取得了显著进展。Taghizadeh-Mehrjardi等人(2020)比较了六种不同的机器学习模型在SOC估算中的准确性,发现深度学习神经网络(DNN)、随机森林(RF)和极端梯度提升(XGBoost)模型的表现优于支持向量机(SVM)、人工神经网络和Cubist模型。同样,我们的研究也发现,在中国喀斯特地区,RF和XGBoost算法在SOC估算中的精度高于SVM(Wang et al., 2023)。知识引导的机器学习方法也被证明是SOC预测的有效手段(Liu et al., 2024)。在最近的研究中,光学遥感数据、环境变量和机器学习算法的结合显著提升了SOC估算和空间制图的准确性。例如,一项研究使用了158个输入变量,生成了具有250米空间分辨率的全球SOC数据集(Hengl et al., 2017),而Liu等人(2022)则在90米至1公里的空间分辨率下绘制了中国土壤特性图。尽管这些方法在SOC估算方面表现出色,但尚未明确其是否能通过引入SAR数据进一步提升预测精度。

数据融合技术通过有效利用观测数据,并借助数学算法优化参数和状态变量,能够提供模拟结果与观测数据之间的最佳匹配(Bastrikov, 2019; Norton et al., 2018)。在多种数据融合方法中,高精度地表建模(HASM)因其整合多源数据的能力而受到关注。HASM利用优化控制和地表理论,成功应用于多个生态建模领域(Yue et al., 2020)。最初作为强化学习方法开发,HASM随后演变为一种基于量子机器学习的框架(Yue et al., 2023)。我们的研究发现,HASM在森林碳储量模拟中提高了40%的准确性(Yue et al., 2020)。此外,在草地生物量碳的研究中,使用HASM进行数据融合的模拟精度比传统方法提高了13%至26%,均方根误差则降低了12%至27%(Zhou et al., 2021)。然而,关于数据融合是否能提升SOC估算的准确性并有效表征其空间分布模式的研究仍较为有限,尤其是在高山生态系统中。

因此,本研究选择了青藏高原的兴海县作为研究区域,以检验以下假设:(1)多源数据驱动的机器学习算法在SOC估算中的精度高于单一数据类型的算法;(2)引入SAR数据能够提高估算精度并增强其在SOC预测中的适用性;(3)利用HASM进行数据融合可以实现SOC空间分布的最佳准确预测。研究过程如图1所示。如果这些假设在采样点稀疏的恶劣自然条件下成立,那么该方法将为全国乃至全球尺度的SOC预测提供一种新颖的解决方案,并为陆地碳汇的空间规划提供科学依据。

兴海县位于中国青海省南部的三江源地区东北部,地理坐标为东经99°01′至100°21′,北纬34°48′至36°14′(图2)。该地区的海拔范围从2600米到5320米,平均海拔为4200米。兴海县总面积为12,100平方公里,总人口约为75,833人。该地区具有典型的高山大陆性气候,太阳辐射强烈,温度变化显著,气候条件较为恶劣。年均气温较低,降水分布不均,冬季寒冷而漫长,夏季短促且凉爽。由于地形复杂、气候条件恶劣,兴海县的土壤形成过程受到多种因素的影响,包括气候、地形、母质、生物因素(如植被、生物活动和土地利用)以及时间。这些因素深刻地影响了土壤特性,为数字土壤制图(Digital Soil Mapping, DSM)提供了重要的理论基础。近年来,许多研究成功地将这些土壤形成因素与土壤采样数据结合,以估算大范围内的SOC含量(Egbert et al., 2022; Hu et al., 2024)。

在本研究中,我们对SOC的统计特征进行了分析。结果显示,SOC的平均含量为30.24克/千克,明显高于中国国家土壤肥力分类标准中SOC含量的第一类标准(23.2克/千克)。变异系数为45.35%,表明数据分布相对均匀(表2)。偏度值为1.22,表明数据呈轻微右偏分布,意味着较高SOC值的出现频率较低,而较低SOC值则更为常见。总体来看,SOC呈现出近似正态分布的特征,但其空间异质性仍然显著。此外,SOC的含量在不同海拔高度和植被类型之间存在较大差异,这为后续的SOC预测提供了重要的数据基础。

在模型驱动变量的相对重要性分析中,我们发现降水、B8A波段等环境变量对SOC的预测具有显著影响。这些变量不仅反映了土壤形成过程中的关键因素,还能够有效捕捉土壤空间分布的模式。例如,降水是影响土壤有机碳含量的重要因素,因为它直接影响土壤的水分状况和有机质的分解速率。B8A波段是光学遥感数据中常用的波段之一,其对土壤有机碳含量的预测能力主要体现在对植被覆盖和土壤湿度的敏感性上。此外,地形因素如坡度、坡向和海拔高度对SOC的分布也具有重要影响,因为它们决定了土壤的水文条件和侵蚀程度。土壤类型和母质作为土壤形成的基础,同样对SOC的含量和分布具有显著影响。这些变量的综合分析为SOC的精准预测提供了重要的依据。

为了评估不同数据融合方法对SOC预测精度的影响,我们对多种数据组合进行了比较分析。结果表明,结合三种数据类型的组合在SOC预测中表现最佳,其R2值显著高于单一数据类型或两两组合的模型。这表明,多源数据的协同应用能够有效提升SOC估算的准确性。此外,使用HASM进行数据融合的模型在预测精度上也表现出色,其R2值提高了18%至22%,均方根误差降低了2%至12%。这说明,HASM作为一种数据融合方法,能够有效优化模型参数和状态变量,从而提高SOC预测的精度。然而,我们也发现,在某些情况下,单一数据类型的模型在特定区域的预测效果可能优于多源数据融合模型,这可能与数据的可用性和区域特性有关。因此,未来的研究需要进一步探索不同数据组合和融合方法在不同生态系统中的适用性。

本研究的结论表明,结合实地调查SOC数据、环境变量、光学和SAR遥感数据以及三种机器学习模型,能够有效提高SOC估算的精度。具体而言,引入SAR数据的模型在SOC预测中的R2值提高了9%至21%,均方根误差则降低了4%至34%。这表明,SAR数据在SOC估算中具有一定的优势,尤其是在植被覆盖较密的区域。此外,环境变量、光学遥感数据和SAR数据的综合应用在SOC预测中表现出最佳效果,其R2值和均方根误差均优于单一数据类型的模型。这一结果为SOC的空间分布提供了更合理的解释,特别是在高山生态系统中,这种多源数据融合方法能够有效修正之前低估或高估的SOC含量,从而提高估算的准确性。

在本研究中,我们还探讨了不同机器学习算法在SOC预测中的表现。结果显示,XGBoost、RF和SVM三种算法在SOC预测中均表现出较高的准确性,其中XGBoost和RF在多数情况下表现更为优异。这可能与这些算法在处理非线性关系和高维数据方面的优势有关。然而,不同算法在不同数据组合下的表现存在差异,这表明算法的选择需要根据具体的数据特征和研究目标进行优化。此外,我们的研究还发现,结合多源数据的模型在预测精度上优于单一数据类型的模型,这进一步验证了多源数据融合在SOC估算中的重要性。

本研究的成果不仅为SOC的精准预测提供了新的方法,也为全球范围内的土壤碳汇评估和管理提供了科学依据。尤其是在采样点稀疏的高山生态系统中,多源数据融合与机器学习技术的结合能够有效弥补数据不足的缺陷,提高预测的可靠性。这为未来在类似生态系统中的SOC估算研究提供了重要的参考价值。同时,本研究的结果也为政策制定者提供了科学支持,帮助他们更好地理解和应对气候变化对土壤碳库的影响。此外,该方法的推广和应用将有助于提高土地管理和碳汇规划的科学性,为实现碳中和目标提供有力的技术保障。

最后,本研究的作者声明他们没有已知的财务利益或个人关系可能影响本研究的成果。本研究得到了国家自然科学基金、中央高校基本科研业务费、重庆金佛山喀斯特生态系统国家野外科学观测研究站开放基金以及国家重点研发计划等项目的资助。这些支持为本研究的顺利进行提供了必要的资源和条件。通过本研究的探索,我们希望为SOC的估算和碳汇策略的制定提供新的思路和技术手段,推动全球碳循环研究的深入发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号