编辑推荐:
肺癌死亡率高,传统 CT 图像分析存缺陷。研究人员开展基于定制卷积神经网络(CNN)结合可解释人工智能(XAI)技术的肺癌检测研究。模型总体准确率达 93.06%,该成果有助于提高早期肺癌检测准确率,改善患者预后。
肺癌,这个每年夺走 180 万人生命的 “健康杀手”,一直稳居全球癌症相关死亡原因的前列。患者预后差,很大程度上归咎于发现时已处于晚期,治疗手段受限,生存率大打折扣。传统的 CT 图像分析方法,不仅耗时费力,还容易出错,严重依赖医生的主观判断。在这样的困境下,为了打破僵局,提高早期肺癌检测的准确率,改善患者的生存状况,Prince Sultan University、Menoufia University、Zagazig University、Cracow University of Technology 等多所国外高校的研究人员展开了深入研究。他们的研究成果发表在《Scientific Reports》上,为肺癌检测带来了新的曙光。
研究人员采用了定制卷积神经网络(CNN)结合可解释人工智能(XAI)技术,尤其是梯度加权类激活映射(Grad-CAM)的方法。研究数据来自 Kaggle 平台的胸部 CT 扫描图像,这些图像被分为鳞状细胞癌、大细胞癌、腺癌和正常细胞四类。通过数据增强、调整网络架构和优化超参数等一系列操作,训练出了性能优异的模型。
研究结果主要包括以下几方面:
- 模型性能评估:模型在测试集上的总体准确率达到 93.06%。从混淆矩阵来看,对腺癌和正常细胞的分类表现出色,准确率和特异性均为 100%,但在大细胞癌和鳞状细胞癌的区分上存在一些失误。例如,有 3 例大细胞癌被误判为腺癌,2 例鳞状细胞癌被误判为腺癌。不过,各类型癌症的敏感度都较高,反映出模型在检测各类癌症时的有效性。
- 训练过程分析:观察模型训练过程中的准确率和损失曲线可知,训练准确率迅速上升,最终稳定在 100%,验证准确率也逐渐提高,最终达到 93.06%。训练和验证损失都快速下降至 0%,这表明模型能够有效地从数据中学习,减少预测误差。
- 性能指标评估:从各项性能指标来看,模型在不同癌症类型上的表现各有特点。腺癌的精准率为 0.8214,召回率为 1.0000,F1 分数为 0.9020,特异性为 0.8980;大细胞癌和鳞状细胞癌的精准率均为 1.0000,但召回率分别为 0.8571 和 0.8667;正常细胞的各项指标均为 1.0000。总体上,模型的精准率为 95.53%,召回率和敏感度为 93.09%,F1 分数为 93.84%,这些数据充分展示了模型的综合性能。
- ROC 曲线分析:通过 ROC 曲线进一步评估模型性能,腺癌、大细胞癌、鳞状细胞癌和正常细胞的 AUC 值分别为 0.96、0.96、0.97 和 1.00。高 AUC 值表明模型在区分不同类型肺癌和正常细胞方面具有很强的能力。
- 特征可视化分析:对卷积层输出进行可视化,发现随着网络层的加深,模型提取的特征逐渐从简单的边缘、纹理等低级特征过渡到复杂的肿瘤特征。Grad-CAM 可视化则突出了对模型预测有重要影响的图像区域,在正确分类的图像中,热图与已知的癌症病理区域吻合,而在误分类的图像中,热图显示出模型受重叠形态特征的影响。
研究结论和讨论部分指出,该模型在多种指标上表现出色,能有效区分多种肺癌类型和正常细胞,但在大细胞癌和鳞状细胞癌的分类上还有提升空间。通过增加训练数据的多样性、采用更先进的特征提取技术等方法,有望进一步提高模型的分类准确率。此外,该模型在临床应用中具有很大潜力,可作为放射科医生的辅助工具,帮助早期检测肺癌,减少诊断错误。不过,实际应用中还面临一些挑战,如不同医疗机构的 CT 图像质量差异、模型的可解释性还需进一步完善等。但总体而言,这项研究为肺癌检测提供了一种创新的方法,将有助于推动肺癌早期诊断和治疗的发展,具有重要的临床意义和应用价值。
研究人员开展研究时用到的主要关键技术方法包括:利用来自 Kaggle 的胸部 CT 扫描图像数据集,通过图像数据增强函数对训练集进行随机旋转、平移和缩放等操作;构建定制的 CNN 模型,包含卷积层、批归一化层、激活层、池化层、Dropout 层和全连接层等;使用 Adam 优化器训练模型,并设置合适的超参数;运用 Grad-CAM 技术对模型预测进行可视化解释。