编辑推荐:
当前胃癌(GC)诊断存在侵袭性、采样误差等问题,传统深度学习模型也有局限性。研究人员开展基于多通道注意力机制(MCAM)和迁移学习(TL)的 GC 分类研究。结果显示该框架在多个数据集分类精度高,为 GC 诊断提供新方案,助力提升诊断准确性。
在医疗领域,胃癌是全球范围内严重威胁人类健康的重大疾病,它长期以来一直是高发且致命的癌症类型之一。据统计,胃癌已成为全球第五大常见疾病和第四大死因,在癌症相关死亡原因中位居第三。早期检测和及时治疗对改善患者预后、降低死亡率至关重要,然而现有的诊断方法却存在诸多问题。目前,GC 的诊断主要依靠内镜检查、活检和组织病理学分析,其中组织病理学研究虽为金标准,但这些方法具有侵袭性,容易出现采样误差,而且不同观察者之间的判断差异也会影响诊断的准确性。此外,早期诊断对于 GC 患者的良好预后至关重要,因此开发更可靠、准确和敏感的筛查与诊断方法迫在眉睫。
在此背景下,来自 King Fahd University of Petroleum and Minerals、Khalifa University 等多个国外研究机构的研究人员开展了相关研究。他们提出了一种基于多通道注意力机制(MCAM)和迁移学习(TL)的框架用于胃癌分类,相关研究成果发表在《Scientific Reports》上。
研究人员为开展此项研究,主要运用了以下关键技术方法:首先,采用卷积神经网络(CNN),如 Inception-V3、VGG-16 和 Xception 等,这些网络在图像特征提取方面具有独特优势;其次,利用迁移学习技术,通过对预训练模型的参数微调,使其适应胃癌诊断任务,同时缓解了医学数据集数据量有限的问题;最后,构建多通道注意力机制,包含多尺度全局信息通道(MGIC)、空间信息通道(SIC)和多尺度空间数据通道(MSIC),以此增强模型对关键特征的捕捉能力 。
下面来看具体的研究结果:
- 实验环境与数据集:使用 GasHisSDB 和 HCRF 两个数据集进行实验。GasHisSDB 数据集包含不同分辨率的正常和异常组织病理图像,HCRF 数据集同样涵盖多种条件下的胃组织病理图像。对数据集进行细致划分,采用随机分割的方式将其分为训练集、验证集和测试集,并对图像进行归一化处理。
- 分类评估:通过生成混淆矩阵评估模型性能。在 GasHisSDB 数据集的不同子数据集及整体数据集上,模型均展现出较高的分类准确率,如在子数据集 A、B 上平均准确率超 99.50%。同时,对模型进行了多种对比实验,与传统深度学习模型相比,该 MCAM 框架在敏感性、特异性和 F1 分数等评估指标上均有提升;与无迁移学习和无注意力机制的模型相比,该框架性能更优。
- 扩展实验:进行消融实验,分别去除 MCAM 框架中的不同通道,结果表明 MGIC 和 MSIC 在框架中起关键作用,SIC 也对框架功能有一定提升;在 HCRF 数据集上实验,模型在验证集和测试集上的平均准确率分别达到 99.84% 和 99.65%,证明了模型的泛化能力;开展模块互换性实验,发现框架中三个通道具有一定的互换性。
在研究结论和讨论部分,该研究提出的 MCAM 框架在胃癌检测方面取得了显著成果,相比传统深度学习模型有明显改进。通过一系列实验,充分验证了该框架的有效性、可靠性和泛化能力。此框架能够帮助病理学家减少诊断错误,有望集成到数字病理工作流程中,为早期癌症检测和治疗规划提供支持。然而,该框架也存在一些局限性,如计算复杂度较高,在资源受限的临床环境中部署可能面临挑战;不同临床环境下图像差异较大,模型的鲁棒性还需进一步提高;此外,模型的可解释性对于临床医生来说还不够详细,罕见胃癌亚型的类不平衡问题也可能导致偏差 。
总体而言,这项研究为胃癌的诊断提供了一种新的、更有效的方法,虽然存在一些不足,但为后续研究指明了方向。未来研究可进一步优化模型架构,探索多模态信息融合,提高模型的计算效率和可解释性,推动人工智能在医学诊断领域的应用,从而为改善患者的治疗效果和预后做出更大贡献。