基于超大核卷积网络RepLKNet的农业病害识别方法研究

【字体: 时间:2025年05月16日 来源:Scientific Reports 3.8

编辑推荐:

  为解决传统卷积神经网络在小核结构下难以捕捉长程依赖和全局上下文信息的问题,研究人员开展了基于超大核卷积网络RepLKNet的植物病害识别研究。通过构建包含61类病害的95,865张图像数据集,采用31×31大核卷积增强特征表征能力,结合迁移学习实现96.03%的整体准确率(OA),较ResNet50提升0.41%。该研究为农业病害智能诊断提供了兼顾全局感知与计算效率的新范式。

  

农业病害智能诊断的瓶颈与突破
植物病害每年造成全球作物减产高达40%,传统人工诊断效率低下且依赖专家经验。尽管深度学习技术已在农业领域广泛应用,主流卷积神经网络(CNN)如ResNet、VGG等普遍采用3×3或5×5小卷积核,需要通过堆叠数十层网络来扩大感受野。这种设计存在固有缺陷:深层网络易出现梯度消失,且逐层传递过程中可能丢失关键空间信息,对于叶片上分散的锈斑、不规则霉变等复杂症状识别效果有限。

云南农业大学的研究团队在《Scientific Reports》发表的研究中,创新性地将超大核卷积网络RepLKNet引入农业病害识别领域。该网络采用31×31超大卷积核,单层即可覆盖叶片大部分区域,直接捕捉病害的全局分布特征。研究构建了包含14种作物61类病害的95,865张高质量图像数据集,通过五折交叉验证证明模型整体准确率达96.03%,Kappa系数95.86%,较传统CNN提升显著。

关键技术方法
研究采用Kaggle公开的Plant Diseases Training Dataset,通过400×400像素裁剪和通道归一化预处理;网络架构包含Stem层(4层卷积与深度可分离卷积组合)、4个Stage层(含31×31至13×13递减的RepLK Block和1×1卷积构成的ConvFFN模块)及Transition层;训练使用ImageNet预训练权重,采用AdamW优化器和LambdaLR学习率调度,在RTX 4090显卡上完成5轮交叉验证;通过Grad-CAM可视化验证特征聚焦区域。

研究结果
RepLKNet实验分析
五折交叉验证显示模型OA稳定在95.55%-96.03%(标准差0.17%),AA达94.72%-95.31%,证明超大核卷积能有效平衡各类别识别性能。迁移学习使模型在10个epoch内快速收敛,验证损失曲线平滑下降至接近零。

消融实验
将31×31核替换为3×3/5×5核后,OA最大降低1.1%(94.93% vs 96.03%),AA下降1.3%,证实大核设计对提升长程特征提取的关键作用。

对比实验
与Swin Transformer(96.12%)、ResNet50(95.62%)、GoogLeNet(94.98%)等对比,RepLKNet在保持Transformer级全局感知能力的同时,计算效率提升20%;显著优于VGG16(93.60%)等传统CNN。

Grad-CAM热图可视化
对桃树褐斑病、甜椒细菌性斑点病等案例的激活图显示,模型注意力精准聚焦于病斑边缘扩散区,超大核能同时捕捉局部纹理变化(如叶脉周围褪绿)和宏观分布模式(如伞状霉层)。

结论与展望
该研究首次系统验证了超大核卷积在农业病害识别的优势:31×31核通过单层操作实现传统CNN需15层堆叠才能达到的感受野,避免深层网络的信息衰减问题。RepLKNet特有的深度可分离卷积和结构重参数化技术,将31×31核的参数量控制在MobileNetV3水平,为田间实时诊断提供可能。

研究仍存在三方面局限:一是固定尺寸裁剪可能截断边缘病斑,未来可结合YOLOv7等检测算法动态定位感兴趣区域;二是大核卷积对早期微小病斑敏感度不足,需探索与GhostNet等轻量化模块的混合架构;三是当前模型在跨作物泛化性上未充分验证,需通过对抗训练增强域适应能力。该成果为农业AI领域提供了新的技术路线,其"全局感知优先"的设计理念可延伸至害虫识别、作物长势监测等场景,推动智慧农业从单点突破向系统化应用迈进。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号