一种基于YOLOv8的全口病变检测改进算法

《Graphical Models》:An improved algorithm for full-mouth lesion detection based on YOLOv8

【字体: 时间:2025年10月07日 来源:Graphical Models 2.2

编辑推荐:

  口腔锥形束CT图像中微小病变的YOLOv8双阶段改进检测方法。首先重构基于MobileNetV3的backbone网络,提升计算效率。其次设计复合特征融合网络,结合BiFPN和PANet机制,有效融合多尺度特征以增强小目标检测能力。进一步引入C2f-SCSA模块,通过空间-通道注意力机制提升特征提取精度。实验表明,该方法在包含15类病变的2000+高质量标注数据集上,mAP提升3.3%,召回率提高4.7%,计算负载仅7.6GFLOPs,显著优于YOLOv8等传统方法,同时保持实时检测性能。

  在口腔医学影像分析领域,锥形束CT(CBCT)技术已经广泛应用于牙齿和颌面部的疾病检测。然而,CBCT图像中存在一些微小的病变,这些病变在传统检测模型中往往难以识别,导致检测准确率较低。为了解决这一问题,本文提出了一种基于YOLOv8的双阶段检测方法,通过优化模型结构和引入新的特征融合机制,提高了对微小病变的识别能力。该方法不仅增强了模型的检测精度,还降低了计算负担,使得在实际医疗场景中实现高效、准确的全口病变检测成为可能。

### 1. 引言

随着数字医疗技术的迅速发展,CBCT图像因其高分辨率和丰富的牙齿结构信息而被广泛应用。全口病变检测能够帮助牙科医生更准确地定位病变位置和形状,制定个性化的治疗方案,从而提高治疗效果。然而,随着CBCT图像数量的增加,传统的人工分析方法不仅效率低下,而且容易受到医生经验的影响,存在较大的局限性。基于机器学习的方法在处理大规模CBCT图像时,也面临特征提取过程繁琐、计算成本高和实时性差等挑战。尤其是在处理复杂和多样化的病变时,特征提取能力有限,容易受到噪声干扰。

### 2. 相关工作

在口腔病变检测领域,许多研究者尝试了不同的方法。传统的深度学习模型如U-Net、Mask R-CNN和Faster R-CNN虽然在某些任务中表现良好,但在实际应用中仍然存在诸多限制。例如,U-Net和Mask R-CNN在处理高分辨率CBCT图像时,常常无法有效捕捉微小病变的细节信息,导致检测效果不佳。Faster R-CNN在处理复杂背景和多尺度病变时,计算成本较高,难以满足实时检测的需求。近年来,基于Transformer的模型在某些任务中表现出更高的检测精度,但其计算成本高、缺乏对局部特征的捕捉能力,不适合用于CBCT图像分析。

YOLO系列模型因其高效的检测能力而被广泛应用于多种任务。YOLOv8在速度和精度上相较于其前身有了显著提升,但在处理微小病变时仍存在一定的不足。为了提升YOLOv8在CBCT图像中的检测能力,许多研究者对其进行了改进,包括优化骨干网络、增强特征融合能力以及引入注意力机制等。例如,一些研究者通过引入轻量级网络如MobileNet来替代YOLOv5的骨干网络,有效降低了计算负担,同时保持了较高的检测精度。此外,也有研究者在YOLOv5中引入了BiFPN双向特征金字塔网络,增强了特征融合能力,从而提高了对小目标的检测精度。

### 3. 改进的YOLO方法

本文提出的改进方法主要包括以下几个方面:

#### 3.1 两阶段YOLO检测方法

为了提高对微小病变的检测能力,我们采用了一种两阶段YOLO检测方法。第一阶段,使用YOLO模型检测并分割单个牙齿,提供粗略的牙齿定位,并生成清晰的局部图像用于后续病变检测。第二阶段,对分割后的牙齿区域进行精细化特征提取,以实现对病变的精确定位。这种分阶段的检测方法能够有效解决YOLOv8在处理小目标时的精度不足问题,提高了整体检测效果。

#### 3.2 MobileNetV3骨干网络

在全口病变检测任务中,处理大量高分辨率的CBCT图像需要高效的计算能力。传统骨干网络如ResNet和VGG虽然精度较高,但计算成本大,难以满足实际医疗场景中的实时性要求。为此,我们选择了MobileNetV3作为骨干网络。MobileNetV3采用了轻量级设计,具有较高的计算效率和较低的内存占用。同时,它在保持一定检测精度的同时,显著降低了计算资源的需求,使得模型能够在资源受限的设备上运行。

#### 3.3 复合特征融合网络

传统的特征金字塔网络(FPN)在多尺度特征融合过程中存在一定的局限性,尤其是其单向的信息流导致低级特征无法有效捕捉高级特征的上下文信息,从而影响小病变的检测精度。为此,我们设计了一种复合特征融合网络,结合了BiFPN和PANet的优点,引入了跳连机制,使得模型能够在不同尺度的特征图之间进行有效融合。此外,我们还引入了P2特征图,以保留小病变的关键信息。通过这种方式,我们能够更好地捕捉不同尺度的特征,从而提高检测精度。

#### 3.4 C2f-SCSA模块

为了进一步提升模型对CBCT图像中病变区域的识别能力,我们设计了C2f-SCSA模块。该模块结合了空间注意力和通道注意力机制,能够更有效地捕捉病变区域的空间信息和通道信息。空间注意力机制通过分配不同的权重来增强病变区域的特征,而通道注意力机制则通过调整不同通道的权重来增强病变特征的表达能力。通过引入这两种注意力机制,我们能够更准确地识别病变区域,提高模型的检测能力。

### 4. 实验

为了验证所提出方法的有效性,我们进行了多组实验,并与主流检测框架进行了比较。实验结果表明,我们的方法在检测精度、召回率和mAP指标上均优于其他模型。具体而言,我们的方法在检测精度上提高了3.5个百分点,在召回率上提高了4.7个百分点,mAP提高了3.3个百分点,同时计算负担仅为7.6 GFLOPs。这些结果充分证明了我们方法在全口病变检测中的优势。

此外,我们还构建了一个高质量的CBCT图像数据集,包含15种病变和超过2000张准确标注的口腔CBCT图像。该数据集为模型训练提供了坚实的数据支持,并进一步验证了我们方法的有效性。在数据集的构建过程中,我们与专业牙科医院合作,确保了数据的准确性和多样性。

### 5. 结论

本文提出了一种基于YOLOv8的改进方法,通过两阶段检测策略、轻量级骨干网络、复合特征融合网络和C2f-SCSA模块,显著提高了CBCT图像中微小病变的检测精度和效率。实验结果表明,我们的方法在检测精度、召回率和mAP指标上均优于传统方法,同时计算负担较低,适合在实际医疗场景中应用。未来的研究可以进一步优化模型结构,探索更轻量级的网络,以实现更高的检测效率和更广泛的临床应用。此外,还可以考虑将CBCT图像与其他类型的医疗影像数据结合,以进一步提高病变检测的准确性和全面性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号