《Scientific Reports》:A new method for Tomicus classification of forest pests based on improved ResNet50 algorithm
编辑推荐:
为解决云南切梢小蠹(Tomicus)准确分类难题,研究人员构建 DEMNet 模型,提升分类精度,为虫害治理提供技术支持。
在广袤的森林中,切梢小蠹(Tomicus)就像隐藏在暗处的 “杀手”,肆意侵害着松树,尤其是在中国西南部的云南省,受灾情况尤为严重。切梢小蠹家族成员众多,像云南切梢小蠹(Tomicus yunnanensis)、横坑切梢小蠹(Tomicus minor)、短毛切梢小蠹(Tomicus brevipilosus)和华山松切梢小蠹(Tomicus armandii)等,它们在形态上极为相似,仅仅依靠肉眼去分辨,就如同在一堆相似的拼图碎片中寻找特定的那一片,难度极大。
传统的分子鉴定和形态识别方法虽然可靠,可就像精密的仪器需要专业的工程师操作一样,这些方法需要专业人员和特定设备,而且十分耗时。对于经验不足的人来说,想要准确识别,简直难如登天。因此,开发一种快速、高效且准确的切梢小蠹分类模型迫在眉睫。
西南林业大学大数据与智能工程学院等机构的研究人员为了解决这一难题,开展了相关研究。他们收集了受切梢小蠹侵害的松树样本,并利用 100 万像素手持 IPS 高清显微镜,拍摄了 6371 张高分辨率图像,构建了一个高质量的数据集。
在此基础上,研究人员提出了一种基于改进 ResNet50 架构的新型切梢小蠹分类模型 ——DEMNet。研究人员在改进 ResNet50 模型时,采用了深度可分离卷积(DS 卷积)替代标准卷积,调整了每个残差模块的输出通道,实现了轻量化模型设计,大大降低了计算复杂度;在改进的残差结构中融入了高效通道注意力(ECA)机制,增强了模型捕捉细粒度特征的能力,提高了分类准确率;还用 MobileNetV3 分类器替换了原来的全连接层,进一步提升了分类精度和泛化能力;此外,将模型中的 ReLU 激活函数全局替换为 PReLU 激活函数,增强了模型在数据处理方面的适应性。
实验中,研究人员使用 AMD R9 - 9950X 处理器、192GB 内存的计算机,基于 PyTorch 深度学习框架,在 NVIDIA 4090 GPU 上对模型进行训练。优化器采用自适应矩估计(Adam)算法,损失函数设置为交叉熵损失,训练 100 个 epoch,批次大小为 32,并通过实验确定了最优学习率为 8.10-4 。
在不同模型的对比实验中,DEMNet 表现出色。它的分类准确率达到了 92.8%,而主流模型 VIT - B/16 的准确率仅为 71.9%;DEMNet 的损失值为 0.220,远低于其他模型,收敛速度更快且更稳定;在轻量化设计方面,DEMNet 参数仅有 1.6M,相较于原始网络减少了 90%,浮点运算次数(FLOPs)为 0.7G,在保持高准确率的同时,显著降低了计算开销。研究人员还在嵌入式设备上开发了切梢小蠹分类系统,用该系统对横坑切梢小蠹图像进行分类,DEMNet 不仅分类准确率高达 93.7%,处理时间也仅需 0.1193 秒。
通过消融实验,研究人员发现不同的注意力机制、PReLU 激活函数和各种增强模块对模型性能影响显著。其中,ECA 模块在捕捉关键特征方面表现突出,使分类准确率达到 92.8%;PReLU 激活函数相较于 ReLU,将分类准确率提高了 5.0%;各个模块的组合使用,让模型在减少参数的同时,分类准确率大幅提升。
在对模型性能进行评估时,研究人员利用混淆矩阵对模型在切梢小蠹数据集上的分类性能进行评估。结果显示,模型对四种切梢小蠹物种的正确分类概率均超过 85%,误分类率较低。
这项研究成果发表在《Scientific Reports》上,具有重要意义。它成功实现了轻量化设计,提高了分类准确率,为切梢小蠹等林业害虫的自动识别提供了有效解决方案,为森林虫害监测和生态保护提供了关键的技术支持。不过,该研究也存在一定局限性,如模型在其他领域的泛化能力还有待进一步验证,训练数据背景较为单一,研究的切梢小蠹物种范围较窄等。未来,研究人员计划收集更多不同背景的样本,扩大切梢小蠹物种和样本数据集范围,并探索使用更新的模型进行对比分析,以进一步完善该研究。
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》