编辑推荐:
乳腺癌严重威胁健康,且受 COVID-19 影响加剧。为解决诊断工具不足问题,研究人员开展结合 EfficientNetB0 和 ResNet50 对乳腺癌组织病理图像分类的研究。结果显示模型准确率达 94% ,该成果有助于乳腺癌诊断和筛查。
在全球范围内,癌症一直是严重威胁人类健康的重大疾病,而乳腺癌更是其中的 “头号杀手”。近年来,COVID-19 大流行犹如雪上加霜,导致癌症的诊断和治疗服务被迫延迟,使得乳腺癌的防治形势愈发严峻。传统的诊断方法,如乳腺 X 线摄影(MG)和超声检查(US),虽然在早期诊断中发挥着重要作用,但它们存在假阳性和假阴性的问题,容易导致误诊或漏诊。而且,现有的深度学习(DL)模型在乳腺癌诊断方面虽然取得了一定进展,但在准确性、计算效率以及对多种评估指标的综合考量上仍存在不足。
为了攻克这些难题,来自南非约翰内斯堡大学、巴基斯坦国家工商管理与经济学院等机构的研究人员展开了深入研究。他们提出了一种全新的模型,将 EfficientNetB0 和 ResNet50 相结合,旨在提高乳腺癌组织病理图像的分类精度,将其分为浸润性导管癌(IDC)和非浸润性导管癌(non-IDC)两类。该研究成果发表在《Scientific Reports》上,为乳腺癌的诊断和筛查带来了新的希望。
研究人员在此次研究中运用了多种关键技术方法。他们使用了来自特定数据集(Dataset-10262)的乳腺癌组织病理图像作为样本。在模型构建方面,采用了 EfficientNetB0 和 ResNet50 这两种经典的卷积神经网络(CNN)架构,并通过特定的参数调整和组合方式,构建了集成模型。同时,运用了图像归一化技术,对输入图像进行预处理,以提升模型的学习效果。
研究结果主要从以下几个方面展开:
- 模型训练与性能评估:研究人员精心调整模型参数,如设置批处理大小为 16、学习率为 1e-4 、动量为 0.9 以及权重衰减为 1e-4 等,并以 128×128 像素的图像尺寸进行训练。在训练过程中,模型的损失显著下降,从 0.028 降至 0.0015 ,这表明模型有效收敛,学习能力较强。通过对测试数据的评估,该模型展现出了卓越的性能,准确率高达 94% ,平均绝对误差(MAE)为 0.0628,马修斯相关系数(MCC)达到 0.8690 。这些指标综合反映出模型在预测 IDC 和 non-IDC 方面具有较高的准确性和可靠性。
- 混淆矩阵分析:通过混淆矩阵对模型性能进行进一步分析,结果显示,对于 IDC 类,模型的真阳性(正确识别为 IDC 的病例)数量为 268,假阳性(错误识别为 IDC 的病例)数量为 36;对于 non-IDC 类,真阴性(正确识别为 non-IDC 的病例)数量为 448,假阴性(错误识别为 non-IDC 的病例)数量为 12。由此计算出的精度、召回率和 F1 分数在 IDC 和 non-IDC 类别中都表现出色,进一步证明了模型的良好性能。
- 统计检验与曲线分析:研究人员还进行了 McNemar 检验和配对 t 检验。McNemar 检验的 p 值为 0.0009 ,表明模型的误分类并非偶然,而是存在一定的规律,意味着模型从数据中学习到了独特的特征和模式;配对 t 检验的 p 值为 0.0005 ,显示模型的预测与实际值之间存在显著差异,且模型并非随机猜测,而是具有明确的分类效果。此外,通过受试者工作特征曲线(ROC)和精确率 - 召回率曲线(PR)分析发现,模型的 ROC 曲线下面积(AUC)为 0.93 ,PR 曲线下面积(AUPRC)为 0.96 ,这表明模型在区分 IDC 和 non-IDC 方面具有很强的能力,能够有效平衡精确率和召回率,在实际应用中可以可靠地进行分类预测。
在研究结论与讨论部分,该集成模型展现出了优于以往研究的性能,在准确性和计算效率方面都有显著提升。与其他模型相比,该模型不仅能够更准确地识别 IDC 和 non-IDC 病例,而且在计算资源的利用上更加高效,更适合在实际临床环境中应用。然而,研究也存在一定的局限性,如数据集的规模和多样性有限,可能影响模型的泛化能力;且未应用数据增强技术,限制了模型对组织病理模式更多变化的学习。
尽管如此,这项研究仍然具有重要意义。它为乳腺癌的诊断提供了一种更高效、准确的方法,有望在临床实践中得到广泛应用,帮助医生更及时、准确地诊断乳腺癌,从而为患者提供更有效的治疗方案,提高患者的生存率和生活质量。同时,研究也为后续的相关研究指明了方向,未来可以进一步探索其他深度学习架构,扩大数据集规模并应用数据增强技术,以进一步提升模型的性能和泛化能力,推动乳腺癌诊断领域的发展。