《Next Research》:Deep Learning Approaches for Robust Mosquito Classification from Body and Wing Images
编辑推荐:
蚊虫分类的深度学习模型比较研究
使用3184个样本对四类形态相似的Aedes蚊种进行分类,比较身体和翅膀图像的分类效果。实验表明MobileNetV2在翅膀图像分类中准确率最高(93.3%),而CNN+MobileNetV2混合模型在身体图像分类中表现最佳(79.6%)。研究验证了轻量级模型和混合架构在蚊媒监测系统中的可行性。
Talha ?rmekaya|Mete Ya?ano?lu
土耳其埃尔祖鲁姆阿塔图尔克大学工程学院计算机工程系
摘要
蚊媒疾病对全球健康构成了重大威胁。传统的形态学和分子方法用于蚊子物种鉴定,通常需要专门的知识或昂贵的实验室设备。然而,利用深度学习方法(特别是卷积神经网络(CNN)进行基于图像的蚊子物种鉴定正成为一种潜在的替代方案。本研究探讨了深度学习方法(尤其是卷积神经网络)在蚊子物种分类中的有效性,并比较了身体和翅膀图像的分类性能。研究使用了3184个样本,涉及四种形态相似的伊蚊属物种(埃及伊蚊、白纹伊蚊、韩国伊蚊和日本伊蚊)。数据集被划分为70%的训练集、15%的验证集和15%的测试集。研究中使用的深度学习模型包括ResNet50、MobileNetV2、EfficientNetV2、DenseNet以及混合模型(CNN + MobileNetV2)。独立的MobileNetV2在翅膀图像分类中取得了最高的准确率(93.3%),而我们提出的混合模型(CNN + MobileNetV2)在身体图像分类中表现最佳(79.6%)。这些结果不仅表明了高预测准确性,还展示了强大的类别区分能力和在各种评估指标上的稳健性。虽然这些发现展示了两种分类方法的潜力,但也指出了实现实际分类系统时面临的一些挑战。研究结果表明,轻量级和混合深度学习架构可以作为开发可扩展的蚊媒监测系统的可靠选择。
引言
蚊媒疾病是热带和亚热带地区最严重的公共卫生威胁之一。全球变暖、森林砍伐、快速城市化和国际贸易增加等大规模环境变化使得伊蚊属等媒介物种得以扩展到以前未受影响的地区。这种扩展不仅加速了病原体的传播,还增加了那些没有先前接触或免疫力的群体的风险[23]。世界卫生组织报告称,由伊蚊传播的登革热这种最常见的病毒感染每年威胁着近40亿人,导致约1亿例确诊病例和4万人死亡。其他蚊媒疾病包括基孔肯雅热、寨卡病毒、黄热病、西尼罗河热、日本脑炎、疟疾和淋巴丝虫病[4,14]。
准确识别蚊子物种对于有效的监测、疫情预测和有针对性的控制策略至关重要。不同的蚊属(伊蚊属、按蚊属和库蚊属)传播不同的病毒和寄生虫病原体(表1),错误的识别可能导致控制措施无效。虽然分子技术(如PCR)可以实现高准确性,但它们成本高昂、耗时且需要专门的实验室设施,因此不适合大规模应用或资源有限的环境[16]。
如表1所示,伊蚊属、按蚊属和库蚊属负责传播多种疾病。每个物种都是多种病毒和寄生虫病原体的媒介,这凸显了它们在全球公共卫生中的重要作用[14]。
人工智能(AI)的最新进展,特别是深度学习(DL)方法(如卷积神经网络(CNN)的发展,使得从图像中自动分类昆虫成为可能,并且具有高准确性[3,17,24]。这些方法减少了对专家分类学家的依赖,允许快速分类,并可以集成到便携式或移动设备中用于现场使用。然而,当前模型存在一些局限性:
•大多数模型是在受控的实验室环境中进行训练和验证的,这限制了它们在多变现实环境中的表现。
•它们通常依赖于整个蚊子的图像,而较少关注翅膀等替代形态特征。
•图像来源的差异(不同设备、光照条件)对模型性能的影响常常被忽视。
对翅膀图像的关注有限值得注意,因为蚊子的翅膀具有特定的脉络图案和形状,这些特征可能比全身图像提供更一致和更具区分性的信息——尤其是在身体受损、不完整或在野外捕获时被遮挡的情况下。因此,将翅膀作为主要识别特征可能会带来更稳健和实用的监测工具。
最近的研究已经表明,翅膀形态可以作为比身体图像更强的分类依据[15,17]。因此,我们研究的创新点不仅在于确认这一发现,还在于探讨轻量级模型(如MobileNetV2)和新型混合模型(CNN + MobileNetV2)是否能够在这些特定数据上实现稳健的分类,提供一种计算成本更低的替代方案。
在这项研究中,我们通过(i)系统地比较使用多种CNN架构的身体和翅膀图像的分类性能,以及(ii)提出一个针对该数据集优化的轻量级混合模型(CNN + MobileNet V2)来解决这些不足。
相关工作
相关研究
本文总结了基于深度学习的蚊子物种分类系统的文献,如表2所示。所回顾的研究根据使用的方法、数据集的详细信息以及获得的实验结果进行了分类。此外,这些研究还根据使用的数据集类型(如翅膀图像、身体图像或组合数据集)进行了分类。
该领域的最新研究表明,卷积神经网络(CNN)在蚊子物种分类方面取得了良好的效果
材料与方法
如图1所示,研究的整体工作流程包括四个主要阶段:图像采集和数据集准备、针对蚊子形态的预处理、使用多种架构和混合CNN–MobileNetV2设计的模型训练,以及使用生物学相关的性能指标进行评估。通过将形态特征(如翅膀脉络图案、腿带和鳞片标记)明确纳入预处理和模型选择中,我们的方法与
实验结果
近年来,深度学习和传统机器学习在各种图像分类任务中变得非常流行,包括昆虫和蚊子物种的分类。已经开发出用于识别不同蚊子物种的深度学习模型(例如埃及伊蚊、白纹伊蚊、韩国伊蚊和日本伊蚊)。传统机器学习方法也被积极用于蚊子物种的鉴定、分类和生态学研究
讨论
我们将深度学习和混合方法应用于蚊子分类的研究结果表明,图像类型(身体与翅膀)对模型的整体性能和可靠性有显著影响。评估了CNN、ResNet50、MobileNetV2、EfficientNetV2、DenseNet121以及提出的混合模型的分类性能。结果显示,MobileNetV2模型在翅膀图像分类中取得了最高的准确率,而混合模型在
结论
本研究分析了蚊子身体形状和翅膀形态通过深度学习方法进行物种识别的具体贡献。我们的结果表明,模型的成功在很大程度上取决于可用的视觉数据,因为身体和翅膀图像需要不同的架构方法。CNN和MobileNetV2架构的结合在处理身体图像时产生了最高的识别准确率,而单独使用MobileNetV2时也取得了最佳结果
数据和材料的获取
本研究中使用和/或分析的数据集可向相应作者提出合理请求后获取。
作者贡献声明
Talha ?rmekaya:方法论、验证、可视化、初稿撰写、审稿与编辑。Mete Ya?ano?lu:数据管理、方法论、验证、可视化、初稿撰写、审稿与编辑。
利益冲突声明
作者声明没有已知的财务利益或个人关系可能影响本文所述的工作。