MLSA:一种用于番茄叶病识别的多头潜在自注意力深度学习网络
《Smart Agricultural Technology》:MLSA: A Multi-Head Latent and Self-Attention Deep Learning Network for Tomato Leaf Disease Identification
【字体:
大
中
小
】
时间:2025年11月08日
来源:Smart Agricultural Technology 5.7
编辑推荐:
番茄叶疾病识别模型基于改进的AlexNet,引入多头潜在注意力(MLA)机制捕捉局部特征,结合多头自注意力(MSA)机制建模全局依赖,并采用早停机制优化训练。实验在8599张数据(含自采集和开源数据)上验证,模型识别准确率达99.47%,参数量16.34M,较EfficientNet-B0等模型精度提升显著,且推理速度满足边缘设备部署需求。
番茄是一种营养丰富的蔬菜,对人体健康有多种益处。然而,番茄叶片的病害对作物的质量和产量造成较大影响。目前,识别番茄叶片病害的方法在提取多尺度病害特征、全局特征捕捉和识别准确率方面存在一定的挑战。为了解决这些问题,我们提出了一个基于深度学习的多头潜伏与自注意力机制(Multi-Head Latent and Self-Attention, MLSA)模型,用于番茄叶片病害的识别。该模型建立在改进的AlexNet架构基础上,通过引入多头潜伏注意力机制和多头自注意力机制,提高了模型对病害特征的捕捉能力,从而提升了识别精度和鲁棒性。此外,我们还引入了早期停止机制,以优化模型的训练过程,提高其泛化能力。
首先,我们对经典的AlexNet进行了优化,增加了卷积层,使其具备更强的特征提取能力。接着,我们在第五层卷积中嵌入了多头潜伏注意力(MLA)模块,该模块能够通过多头并行计算和潜伏特征交互,使模型能够动态聚焦于关键区域,有效识别局部病斑特征并抑制背景干扰。同时,在第六层卷积中引入了多头自注意力(MSA)机制,以捕捉图像中的全局特征,进一步提升模型对病斑区域的语义信息整合能力。通过这两者的协同作用,模型在复杂遮挡和分散病斑的场景中表现出更强的识别能力。此外,我们还引入了早期停止机制和自适应学习率调度策略,以防止模型在训练过程中过拟合,并促进模型的稳定收敛。
实验数据集包含8599张图像,包括健康的叶片和三种典型的病害(即目标斑点、叶斑病和早期斑点)。实验结果表明,所提出的MLSA模型在16.34M参数的情况下达到了99.47%的识别准确率。与当前最先进的算法EfficientNet-B0、MobileOne-S0和OverLoCK-B相比,MLSA在计算速度、识别精度和泛化能力方面均表现出色。此外,该模型适用于边缘计算设备的部署,具有广泛的推广意义和应用潜力,特别是在智能农业领域。
在传统方法中,番茄叶片病害的识别通常依赖于人工设计的特征提取和图像处理技术。例如,使用支持向量机(SVM)和随机森林(RF)等机器学习算法进行病害预测,虽然在某些特定场景中可以达到较高的识别准确率,但这些方法通常需要复杂的图像处理过程,增加了病害识别工程的复杂性。相比之下,深度学习方法在图像分类领域展现了更高的识别准确率和灵活性,特别是在动态自然环境中,如光照变化、遮挡和病害形态多样性等方面,表现出更强的适应能力。例如,Chen等人提出基于B-ARNet的番茄叶片病害识别方法,整体识别准确率为89%;Rezaei等人使用MobileNet识别大麦病害,准确率达到98.63%;Dosset等人设计CDDNet识别木薯病害,准确率达到98.95%;Zhang等人创建MAIRNet-101,识别植物叶片病害的准确率为95.30%;Tan等人开发基于生成对抗网络(GANs)的光谱增强模型,实现了94.52%的早期病害识别率。这些研究表明,深度学习在病害识别任务中展现出良好的效果,但仍有改进空间。
本文提出的方法在多个方面进行了创新。首先,通过增加卷积层,提升了AlexNet的特征提取深度,使其能够更有效地捕捉病害的细微特征和复杂纹理。其次,通过引入多头潜伏注意力机制和多头自注意力机制,分别处理局部特征和全局特征,从而实现了对病害特征的全面捕捉。此外,早期停止机制和自适应学习率调度策略的引入,使得模型在训练过程中能够更有效地避免过拟合,提升其泛化能力。
实验结果显示,所提出的MLSA模型在识别番茄叶片病害方面表现优异。该模型在测试集上达到了99.47%的识别准确率,相较于其他方法如EfficientNet-B0、MobileOne-S0和OverLoCK-B,其计算速度更快,识别精度更高,并且在复杂场景下具有更强的鲁棒性。此外,该模型在边缘计算设备上的部署能力也得到了验证,其参数量和计算量均较低,适用于资源受限的农业环境。
在数据集方面,我们使用了来自河南省番茄种植基地的原始图像和通过生成对抗网络Pix2Pix生成的图像,构建了一个包含8599张图像的数据集。该数据集包括健康的叶片和三种典型的病害,即目标斑点、叶斑病和早期斑点。为了验证模型的泛化能力,我们还使用了公开的New Plant Diseases Dataset数据集,该数据集包含22930张番茄叶片病害样本,包括9种病害和1种健康的叶片。通过在不同数据集上的实验,我们验证了MLSA模型的有效性和适用性。
在模型的实验设置中,我们使用了一台配备AMD Ryzen 7 4800H处理器、32GB内存和NVIDIA GeForce GTX 1650 Ti显卡的个人计算机进行训练和测试。为了加速训练过程,我们利用了CUDA 11.8和cuDNN 8.7库。软件环境基于Windows 10 ×64操作系统,代码使用Python 3.12和PyCharm 2021.1.3开发。所有模型均基于PyTorch 2.3框架进行训练和测试。通过比较不同参数设置下的实验结果,我们选择了最优的训练参数,以确保模型在测试集上达到最佳的识别效果。
在实验结果部分,我们展示了MLSA模型在不同数据集上的识别效果。通过对比实验,我们发现MLSA模型在识别番茄叶片病害方面表现优异,特别是在处理复杂遮挡和分散病斑的场景时,能够更有效地捕捉病害特征并提高识别准确率。此外,我们还通过混淆矩阵和条形散点图对模型的性能进行了可视化分析,进一步验证了MLSA模型的有效性。
综上所述,本文提出的MLSA模型在番茄叶片病害识别任务中展现了显著的优势。通过优化AlexNet架构,引入多头潜伏注意力和多头自注意力机制,以及结合早期停止和自适应学习率调度策略,该模型在计算效率、识别精度和泛化能力方面均优于现有方法。此外,该模型在边缘计算设备上的部署能力也得到了验证,为智能农业提供了切实可行的解决方案。未来的研究方向将包括扩大数据集范围,探索多模态数据融合,以及进一步优化模型结构,以提升其在复杂病害识别任务中的性能。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号