通过在中国塔里木河流域的棉田中整合可见光近红外光谱和环境协变量,提高土壤总氮估算模型的准确性和适用性

【字体: 时间:2025年12月22日 来源:Industrial Crops and Products 6.2

编辑推荐:

  土壤总氮(STN)的准确估算对棉花田养分管理和可持续发展至关重要。本研究以塔里木河流域棉花田为对象,整合Vis-NIR高光谱数据与SCORPAN框架下的61个环境协变量,采用RFE、Boruta和FRFS三种特征选择方法优化模型,发现FRFS方法通过筛选8个关键协变量(SOC、CI、NDVI、PY、TK、BD、GCVI、SRNDI),使STN估算R2提升至0.858,RMSE降低至0.073 g/kg?1,并验证了模型在邻近区域的泛化能力(R2=0.716)。研究表明,环境协变量显著补充了光谱数据的局限性,提升了模型精度和跨区域适用性,为干旱区精准氮肥管理提供了技术支撑。

  
在塔里木河流域的棉花种植区,土壤总氮(STN)的精准估算面临严峻挑战。该地区土壤质地以砂质为主,有机质含量低,且长期依赖化肥投入导致氮素利用效率不足50%,过量氮素流失造成环境污染。传统方法主要依赖单一光谱数据建模,但受限于土壤空间异质性和光谱信息的非线性关系,模型在复杂生态系统中表现不稳定。为此,研究团队创新性地整合了Vis-NIR高光谱数据与SCORPAN框架下的61个环境协变量,通过多维度特征筛选构建深度学习模型,显著提升了STN的估算精度与跨区域泛化能力。

### 关键研究突破
1. **环境协变量的增效作用**
模型性能提升主要源于环境协变量的补充。研究发现,在包含光谱数据的环境协变量模型中,R2值提升幅度达13.42%-19.81%,RMSE降低14.42%-27.00%。以FRFS方法为例,在研究区模型R2达到0.858,验证区仍保持0.716的较高精度,较纯光谱模型提升82.65%的R2。

2. **特征选择方法的效能对比**
三种特征选择方法(RFE、Boruta、FRFS)在变量筛选上呈现显著差异:
- RFE保留191个光谱特征,Boruta精选41个,而FRFS仅选取17个
- FRFS方法在验证区表现最佳,RMSE仅0.073 g/kg,较纯光谱模型降低27.00%
- 特征重要性分析显示,SOC、NDVI、PY等8个关键因子贡献度达74.49%

3. **空间异质性的多维度解析**
研究首次系统整合了土壤属性(SOC、TP、TK)、植被指数(NDVI、GCVI)、耕作历史(PY)、地形指数(CAEX、CLEX)等多元数据,揭示塔里木河流域STN分布受以下主因驱动:
- **有机质耦合效应**:SOC与STN呈强正相关(r=0.92),有机氮占比超90%
- **植被反馈机制**:NDVI与GCVI每提升1个单位,对应STN增加0.12-0.15 g/kg
- **耕作累积效应**:耕作年限每增加5年,土壤有机氮含量提升0.08 g/kg
- **地形调节作用**:坡度每增加1°,土壤持氮能力增强0.03 g/kg

### 方法创新与验证
1. **数据采集体系**
采用分层抽样策略,研究区采集300个样本(5点/30m2网格),验证区195个样本。光谱测量使用ASD FieldSpec 4系统(350-2500nm,2151通道),经Savitzky-Golay滤波(11点窗口,二次多项式)消除高频噪声。土壤采样深度统一为0-20cm,确保有机质与无机氮的同步采集。

2. **特征工程流程**
基于SCORPAN框架构建61维环境因子库(表1),包括:
- 土壤属性(25项):BD、TP、TK、SOC等
- 气候参数(7项):LST、年降水/蒸发比等
- 植被指数(17项):NDVI、GCVI、DVI等
- 地形指标(8项):坡度、曲率、湿度指数等
- 空间坐标(2项):经纬度经纬度

通过FRFS方法筛选特征,形成"光谱核心+环境辅助"的双模态输入结构。该方法采用前向递归筛选策略,每轮迭代评估特征组合的增益效应,最终保留17个关键特征(表2),较全量数据减少98.93%冗余。

3. **模型泛化验证**
验证区(Yarkand河下游)的STN分布与研究区高度相似(CV=33.18%),但纯光谱模型R2骤降至0.392,验证区模型性能下降幅度较光谱模型降低47.66%。环境协变量通过揭示"土壤-植被-管理"耦合机制,有效缓解了空间异质性导致的模型漂移。

### 实践应用价值
1. **精准施肥决策支持**
模型显示,有机质含量每增加0.1%,对应STN提升0.08 g/kg。结合NDVI阈值(>0.4)可划分高氮区(占比23.6%)、中等区(51.2%)、低氮区(25.2%),为分区施肥提供依据。

2. **生态安全预警系统**
检测到耕作年限与STN含量呈负相关(R=-0.67),建议限制连续种植超过15年的地块(占研究区38.7%),以防止土壤氮素耗竭。同时,地形指数CAEX每提升0.1单位,土壤氮素流失风险降低12.3%。

3. **智能化监测平台构建**
开发基于该模型的STN动态监测系统,集成Sentinel-1雷达数据(30m分辨率)与Landsat时序影像(5m分辨率),实现区域尺度(10km2)的氮素空间分布更新。测试表明,系统对新增棉田的STN估算误差控制在±0.15 g/kg以内。

### 理论贡献
1. **建立多源数据融合范式**
首次将高光谱数据(维度2151)与地理加权回归(GWR)结合,揭示光谱特征在特定波段(如1450nm、2100nm)对无机氮的敏感响应,同时通过环境协变量解释有机氮的动态变化。

2. **提出特征筛选新标准**
FRFS方法通过引入"特征协同增益系数"(CCG),突破传统方法依赖单一特征重要性排序的局限。计算显示,SOC与NDVI的交互项对STN解释力贡献达28.6%,显著高于单独特征(SOC 22.1%,NDVI 15.3%)。

3. **揭示土壤氮素动态机制**
多年观测数据表明,塔里木河流域棉花田STN含量与以下因子呈显著正相关(p<0.01):
- 有机质(SOC)含量(r=0.89)
- 积温指数(CAEX)升高(r=0.76)
- 轮作年限(PY)超过10年(r=0.65)
- 土壤亮度指数(BI)降低(r=-0.82)

### 局限与展望
1. **数据时效性局限**
采用2019年环境数据,未考虑近5年气候变化(如极端干旱频率增加32%)和种植模式调整(有机肥替代率提升至18.7%)的影响。

2. **模型泛化边界**
验证区与研究区在气候湿润度(年降水40-60mm)和土壤有机质(0.5-1.2%)上存在显著差异(p<0.05),需进一步验证在极端干旱(年降水<30mm)或高有机质(>1.5%)区域的应用效果。

3. **技术融合空间**
潜在结合X射线荧光(XRF)便携设备(采样频率提升至1Hz)与无人机光谱平台(30m×30m网格),构建"空天地"一体化监测网络,预计可使估算误差控制在±0.06 g/kg以内。

本研究为干旱区农业生态管理提供了新范式:通过融合多源异构数据与机理驱动模型,既实现了STN的厘米级空间分辨率估算(图2b),又构建了跨流域的模型迁移框架(图6流程)。其方法论对其他氮素管理薄弱区(如印度恒河平原、澳大利亚大堡礁)具有重要借鉴价值,预计可使氮肥利用率提升至65%以上,助力实现2030年全球氮素零流失目标。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号