土壤剖面的分层结构:动态短距离Mamba网络
《Computers and Electronics in Agriculture》:Stratified layering for soil profile: Dynamic short field Mamba network
【字体:
大
中
小
】
时间:2025年11月13日
来源:Computers and Electronics in Agriculture 8.9
编辑推荐:
准确分层是土壤农业调查的基础任务,本文提出基于视觉Mamba UNet(VM-UNet)的动态短场Mamba(DSFM)网络,通过相似性编码模块(SESF)优化多层土壤的空间特征提取,结合动态位置编码模块(DPE)处理模糊过渡层,实验表明DSFM在分层准确率(OA)和交并比(mIoU)上分别提升6.98%和10.46%,显著优于原VM-UNet。
土壤剖面的准确分层是农业调查中的基础任务。为了实现这一目标,研究者提出了一种基于视觉Mamba UNet(VM-UNet)架构的动态短域Mamba(DSFM)网络。该网络通过优化多层土壤剖面的空间特征提取,以及增强模型对层间位置变化的敏感性,从而在土壤剖面分层任务中取得显著效果。实验结果显示,DSFM网络在土壤剖面分层任务中达到了78.99%的总体准确率(OA)和60.22%的平均交并比(mIoU),分别比原始VM-UNet提高了6.98%和10.46%。这表明DSFM网络在分层精度方面实现了显著提升。
土壤是农业发展和人类生存的基础,土壤剖面则是土壤特性的关键载体。由于不同土壤类型之间的结构差异较大,人们可以通过其土壤剖面准确识别土壤种类。因此,土壤剖面分层成为土壤研究中的关键材料。然而,非土壤科学专家往往难以正确完成这一任务。随着图像分割技术的进步,计算机视觉被引入以实现土壤剖面的自动分层,这一领域正逐渐成为新的研究方向。
目前,关于土壤剖面图像的自动分层研究仍然较为有限。在农业图像分割任务中,以往的研究主要集中在特定任务上,如表层土壤分割、自动化收割和作物识别。这些研究引入了通用型网络,如Mask R-CNN、FoveaBox和Mask2Former。然而,这些网络并未专门针对具有类似结构的土壤剖面进行优化,因为它们在开发过程中并未充分考虑多层结构数据的特性。
在以往的研究中,仅有地质剖面显示出与土壤剖面较为相似的分层结构。为了识别地质剖面中的盐体、地层和海平面边界,Li等人(2020)使用了U-Net网络,其U型结构和跳接连接能够整合不同分辨率的特征信息,从而实现分割。地质剖面具有显著的演化特征,这些特征随地质时期的不同而变化。Guo等人(2023)提取了地质剖面的时间特征,并构建了MCD-ABiLSTM网络,用于识别盐体和沉积层。然而,地质剖面中的层间差异较大,这些差异源于长期的沉积作用。相比之下,土壤剖面具有丰富的分层结构和不明显的边界,因此上述网络无法直接用于土壤剖面图像的分层。
目前,土壤剖面图像的研究主要集中在以下几个方面。为了验证地面穿透雷达(GPR)在土壤剖面研究中的应用,Li等人(2020)基于土壤的介电常数和回波信号的频域幅度,建立了相关公式。他们利用短时傅里叶变换(STFT)估计电磁波的传播速度,从而计算出土壤剖面中各层的位置和厚度。然而,随着探测深度的增加,雷达回波信号的能量显著衰减,这使得深层土壤剖面特征的准确表示变得困难。
Gallegos等人(2021)和Gallegos与Bautista(2022)则将土壤剖面的RGB图像转换为HSV和CIE Lab*颜色空间,以获取颜色特征,并利用K-means聚类方法对火山土壤层进行分层。除了分析土壤的颜色特征,Zhang和Hartemink(2019)还采用基于局部区域的方法提取纹理特征,并将其整合到高维特征向量中。随后,这些高维特征向量通过K-means聚类进行处理,计算出类中心以估计土壤剖面中各层之间的下边界。Yang等人(2024)则针对紫色土壤剖面的特殊性,保留其CIE Lab颜色空间中的a和b通道以及纹理特征的熵值,利用K-means聚类方法识别紫色土壤剖面的层间边界。
然而,传统的K-means聚类算法依赖于像素分类进行土壤剖面的分层,这种方法更适合处理已有的聚类数据,而非具有多层结构的土壤剖面,导致土壤剖面图像中层间分层出现交织现象。传统的算法在处理具有丰富分层结构和微妙梯度过渡的土壤剖面时效果不佳。尽管深度神经网络在各种分割任务中取得了显著成果,但它们尚未被广泛应用于土壤剖面的分层任务。因此,探索深度神经网络在这一领域的潜力具有重要意义。
本研究引入了Vision Mamba UNet(VM-UNet)网络,并对其视觉状态空间(VSS)块模块进行了改进,从而开发出Dynamic Short Field Mamba(DSFM)网络。该网络通过增强特征提取能力,提高了土壤剖面分层的准确性。DSFM网络的技术实现路径如图1所示。
DSFM网络在土壤剖面分层任务中的主要贡献包括以下三点:首先,短域相似性编码器(SESF)模块能够计算多层土壤剖面中相邻区域之间的相似性,从而减少层间冗余计算,并生成适合分层特征提取的短域相似性矩阵。其次,动态位置编码器(DPE)模块将短域相似性矩阵与静态位置向量相结合,通过正弦和余弦频率函数动态调整和交叉修改位置编码,生成动态位置矩阵,从而增强模型对土壤剖面中微妙层间变化的识别能力。第三,SESF模块和DPE模块被嵌入到VM-UNet的VSS块模块中,形成DSFM网络,用于土壤剖面的分层任务,并通过提升模型对细粒度层间变化的捕捉能力,优化分层性能。
本文的组织结构如下。第2.1节介绍了图像数据的采集,第2.2节讨论了土壤剖面图像数据集的构建。第2.3节分析了原始网络的性能,第2.4节介绍了SESF模块和DPE模块。第3节提供了实验结果和分析。最后,本文总结了研究发现并展望了未来发展方向。
为了确保多层土壤剖面特征的完整性,研究采用了标准的剖面坑规格:2.0米(长)×1.0米(宽)×1.5米(深)。当土壤层厚度不足时,继续向下挖掘至母质层,以充分展现土壤剖面的特征。选择坡地的南侧作为土壤剖面的观察面。在垂直调整后,将观察面划分为两个对比区域。左半部分经过处理后,能够更好地呈现土壤剖面的细节信息。
实验的硬件和软件环境包括:Intel(R) Core i9-14900 K CPU、NVIDIA GeForce RTX 4090 GPU以及64GB的RAM。操作系统为Ubuntu 20.04,使用的编程语言为Python 3.10.0,深度学习框架为PyTorch 2.1.0,代码编写工具为VSCode 1.93.0。
实验参数设置如下:批量大小为8,初始学习率为0.0001,epsilon值为1e-08,优化器采用Adam算法,训练轮数为100,动量参数为(0.9, 0.999)。这些参数的选择旨在平衡模型的训练效率和最终性能,确保在复杂数据集上的有效分割。
为了验证所提出的DSFM网络及其模块的有效性,研究设计了五项详细的实验。实验过程中,研究人员对比了DSFM网络与其他主流网络(如Swin-Transformer、Twins和ViT)在处理包含岩石、不规则分层和复杂地质因素的土壤剖面数据集时的表现。实验结果表明,DSFM网络在这些任务中表现更优,尤其是在处理具有微妙梯度过渡的土壤剖面时,其性能显著提升。
DSFM网络通过集成SESF和DPE模块,增强了对土壤剖面垂直分层特征的捕捉能力。这一改进使得模型在处理渐变分层变化时表现出更高的准确性,并有效支持了土壤剖面分层任务。与主流网络相比,DSFM网络在处理包含复杂因素的土壤剖面数据集时,能够更准确地识别各层之间的边界,提升整体分割效果。
此外,DSFM网络在处理不同土壤类型时展现出良好的适应性。由于土壤剖面的结构和特征因土壤类型而异,模型能够根据不同的输入数据动态调整其特征提取策略。这种灵活性使得DSFM网络在面对多种土壤剖面时,能够保持较高的分割准确率。
在实验设计过程中,研究人员采用了多种评估指标,包括总体准确率(OA)和平均交并比(mIoU)。这些指标能够全面衡量模型在分割任务中的表现。通过对比不同网络在这些指标上的得分,可以清晰地看到DSFM网络在土壤剖面分层任务中的优势。
实验结果显示,DSFM网络在OA和mIoU方面均优于其他主流网络。例如,在处理包含岩石和不规则分层的土壤剖面数据集时,DSFM网络的OA达到了78.99%,而其他网络的OA则低于这一数值。这表明DSFM网络在处理复杂数据时具有更强的鲁棒性。
同时,DSFM网络在处理具有细微梯度过渡的土壤剖面时,表现出更高的敏感性。由于土壤剖面的层间边界往往不明显,传统的分割方法容易出现误判。而DSFM网络通过动态位置编码器(DPE)模块,能够更准确地捕捉层间位置的变化,从而提高分割的准确性。
在实验过程中,研究人员还分析了不同数据集对模型性能的影响。例如,在处理不同深度的土壤剖面数据时,DSFM网络能够更有效地提取深层特征,而其他网络则在深层特征提取上表现较差。这表明DSFM网络在处理深层土壤剖面时具有更强的适应能力。
此外,DSFM网络在处理不同分辨率的土壤剖面图像时,能够保持较高的分割精度。这得益于其优化的特征提取机制,使得模型在不同分辨率下都能准确识别各层之间的边界。相比之下,其他网络在处理不同分辨率的图像时,分割效果往往不稳定。
在实际应用中,DSFM网络能够为农业调查提供有力支持。通过自动识别土壤剖面的分层结构,研究人员可以更高效地分析土壤特性,为农业生产提供科学依据。此外,该网络还可以用于土壤改良、土地利用规划等任务,为相关领域的研究和应用带来新的可能性。
DSFM网络的成功不仅依赖于其先进的网络结构,还与实验设计和数据处理方法密切相关。在数据采集过程中,研究人员采用了标准的剖面坑规格,并通过垂直调整确保数据的完整性。这些数据采集方法为模型训练提供了高质量的输入,从而提高了分割的准确性。
在实验设计过程中,研究人员采用了多种方法,包括图像数据的预处理、模型训练和评估。通过合理设置实验参数,研究人员能够确保模型在训练过程中保持良好的收敛性,并在测试阶段表现出优异的性能。这些实验设计方法为DSFM网络的优化提供了坚实的基础。
总的来说,DSFM网络在土壤剖面分层任务中表现出显著的优势。其通过优化特征提取机制和增强模型对层间位置变化的敏感性,提高了分割的准确性。同时,该网络在处理复杂数据时展现出良好的适应能力,为农业调查和相关领域的研究提供了新的工具和方法。未来,研究将继续优化DSFM网络,探索其在更多土壤类型和更复杂环境下的应用潜力,以进一步提升土壤剖面分层的准确性和效率。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号