编辑推荐:
白细胞(WBC)检测在医学诊断中至关重要,但传统方法耗时费力,卷积神经网络(CNNs)和 Transformer 在 WBC 检测中存在局限。研究人员提出 MCDAF-Net,在多个数据集上表现优异。该研究为医学图像分析提供新方案,提升了 WBC 检测的准确性和效率。
在医学领域,白细胞检测是诊断多种疾病的关键环节,如感染、炎症以及某些癌症等。通过检测白细胞,医生能够获取人体健康状况的重要信息,从而为疾病诊断和治疗提供有力依据。然而,传统的白细胞检测方法却存在诸多弊端,不仅需要耗费大量的人力和时间,而且检测效率低下。随着深度学习技术的飞速发展,卷积神经网络(CNNs)和 Transformer 逐渐在医学图像分析领域崭露头角。CNNs 凭借强大的特征提取能力,在图像识别任务中表现出色;Transformer 则借助自注意力机制,在捕捉长距离依赖关系方面具有独特优势。但当将它们应用于白细胞检测时,却遇到了不少难题。CNNs 难以处理白细胞图像中的全局信息和长距离依赖关系,在面对尺度变化较大的白细胞时,容易出现检测不准确的情况;Transformer 虽然在处理长距离依赖上表现优异,但计算复杂度高,在高分辨率图像上效率较低,并且对大规模数据集的依赖也限制了其在数据相对稀缺的医学领域的应用。为了解决这些问题,来自安庆师范大学的研究人员开展了一项关于白细胞检测的研究,旨在开发一种更高效、准确的白细胞检测方法。
研究人员提出了一种名为多尺度交叉变形注意力融合网络(MCDAF-Net)的新型白细胞检测模型,该模型巧妙地结合了 CNNs 和 Transformer 的优势。研究结果显示,MCDAF-Net 在多个公开数据集(如 LISC、BCCD 和 WBCDD)上的表现均优于其他模型,展现出了在白细胞检测方面的卓越性能。这一研究成果意义重大,它为医学图像分析提供了一种新的有效解决方案,有望推动白细胞检测技术的进一步发展,提高疾病诊断的准确性和效率,为临床治疗提供更可靠的依据。该研究成果发表在《Scientific Reports》上。
研究人员在开展此项研究时,运用了多种关键技术方法。在模型构建方面,采用 ResNet50 作为骨干网络来提取浅层特征,通过 MCDAF 模块进行特征精炼,结合 Transformer 结构获取长距离上下文依赖关系。其中,MCDAF 模块包含注意力多尺度感知模块(AMSM)、自适应平均池化和 1×1 深度卷积(DWconv)组成的 ADP 模块以及交叉变形卷积模块(CDCM)。在训练和评估环节,使用了四个数据集,包括三个公开数据集和一个私人数据集,对数据进行增强处理,并设置不同的训练参数和优化器进行模型训练,采用多种评估指标与其他模型进行对比。
下面来看具体的研究结果:
- 数据集与数据增强:研究使用了四个数据集,分别是 RSLI、LISC、BCCD 和 WBCDD。RSLI 是私人数据集,其他三个为公开数据集。这些数据集包含不同类型和数量的白细胞样本。为了增强模型的鲁棒性,研究人员对所有训练数据集进行了数据增强,通过旋转、翻转、调整对比度和亮度以及添加高斯噪声等技术,将数据集大小增加了十倍,并对类别不平衡问题进行了处理。
- 模型实现与参数设置:模型基于 pytorch 深度学习框架实现,运行在 Windows10 操作系统上,使用特定的 CPU、RAM 和 GPU。骨干网络由预训练的 ResNet50 初始化,并通过迁移学习微调权重。采用早期停止策略防止过拟合,设置了不同的训练轮数、批次大小、学习率等参数,使用 AdamW 优化器对检测网络进行优化。
- 模型性能对比:将 MCDAF-Net 与多种先前的方法(如 Faster R-CNN、RetinaNet、SSD 等)在不同的白细胞对象检测数据集上进行比较。结果显示,MCDAF-Net 在多个数据集上的平均精度(AP)、AP50和 AP75等指标上均取得了优异成绩。例如在 LISC 数据集上,MCDAF-Net 的 AP 达到 80.7%,AP50为 100%,AP75为 99.5%,相比其他模型有显著提升。
- 消融研究:对 MCDAF-Net 中的各个模块进行消融研究,结果表明每个模块都对模型性能有显著贡献。例如,AMSM 和 CDCM 模块的逐步集成能够系统地提高检测精度,完整的 MCDAF 配置实现了最佳性能指标。同时,研究还探讨了不同扩张率对 AMSM 模块的影响,发现扩张率为 2, 3, 6 时模型性能最佳。
- 模型可视化分析:通过与具有 Transformer 结构的竞争模型进行对比可视化,直观地展示了 MCDAF-Net 在预测白细胞类别和位置方面的准确性和有效性。模型的预测边界框能够准确对应检测到的细胞,具有较高的预测置信度和近乎完美的位置精度。
研究结论和讨论部分进一步强调了 MCDAF-Net 的重要意义。该模型通过集成多尺度扩张卷积和水平 - 垂直卷积,提高了感受野效率,同时保留了详细的局部信息。自注意力机制的引入优化了特征提取,CDCM 模块有效减少了通道冗余,增强了特征的独特性。此外,采用 DIOU 损失函数解决了白细胞检测中细胞重叠的问题,提高了检测精度。不过,研究也指出当前模型存在参数数量较多的问题,未来计划开发轻量化模型以提高计算效率和可扩展性。同时,为了更好地适应不同数据集,研究人员还将致力于开发能够自动调整扩张率的自适应模块,进一步提升模型的适应性和泛化能力。总之,MCDAF-Net 为白细胞检测提供了一种创新且有效的方法,为医学图像分析领域的发展开辟了新的道路。