基于深度集成学习的CT图像慢性肾病检测优化研究:Swin Transformer与卷积神经网络的协同创新

【字体: 时间:2025年06月09日 来源:Franklin Open

编辑推荐:

  针对慢性肾病(CKD)早期诊断准确率不足的临床挑战,本研究创新性地整合Swin Transformer、CCT等视觉Transformer与VGG16、Inception-v3等卷积神经网络,构建加权集成模型。通过分析12,446例CT图像,实现99.67%的总体准确率,较基线模型提升0.15%,特别在肾结石检测(F1 score=0.989)方面取得突破,为LI-LMIC地区(低收入和中等收入国家)的智能诊断系统开发提供新范式。

  

慢性肾病(CKD)已成为全球公共卫生的重大威胁,预计到2040年将成为全球第五大致命疾病。在低收入和中等收入国家(LI-LMIC),医疗资源匮乏与专业肾病医师短缺使得早期诊断尤为困难。传统CT影像诊断依赖医师经验,而现有AI模型在肾结石等复杂病变识别上仍存在显著误诊风险。Wang等研究者曾报道CNN模型对肾结石检测准确率仅94.7%,Abraham等改进至98%,但临床需求仍呼唤更高精度的解决方案。

为突破这一技术瓶颈,研究人员开展了一项开创性研究,通过集成前沿的视觉Transformer与卷积神经网络架构,构建了两种创新性集成模型:Inception-v3-CCT-SwinT(集成组1)和VGG16-EANet-ResNet50(集成组2)。研究团队采用包含12,446例CT图像的数据集,涵盖肾囊肿(3,709例)、肾结石(1,377例)、肾肿瘤(2,283例)和健康肾脏(5,077例)四类样本,图像分辨率分别适配不同模型需求(168×168至299×299像素)。通过数据增强技术(随机旋转15°、缩放0.2倍率、垂直/水平翻转)有效平衡了数据集。

关键技术方法包括:1)采用六种基线模型(SwinT、CCT、VGG16、Inception-v3、EANet、ResNet50)建立性能基准;2)设计并行集成架构,应用软投票(soft voting)和加权软投票决策融合策略;3)引入外部注意力机制(EANet)和残差连接(ResNet50)等创新结构;4)通过混淆矩阵、精确度(P)、召回率(R)和F1
score等指标全面评估性能。

研究结果部分显示,基线实验中Swin Transformer以99.52%的准确率领先,对肾囊肿的召回率达100%,但肾结石识别仍存在2.2%的漏诊。集成模型表现更为突出:

  1. 材料与方法:创新性地将SwinT的层次特征学习与CNN的局部特征提取相结合,加权集成1(0.7权重赋予SwinT)实现99.67%的总体准确率。
  2. 结果与讨论:肾结石检测仍是最大挑战,加权集成1将F1
    score提升至0.989,但仍有3例结石被误判为囊肿,这与结石形态学特征复杂性的文献报道一致。
  3. 技术突破:SwinT的shifted window自注意力机制(1
    )和CCT的卷积嵌入技术协同作用,使模型在保持线性计算复杂度的同时增强特征提取能力。

研究结论指出,这种集成策略在医疗诊断领域具有重要价值:首先,0.15%的精度提升在临床场景中意味着每年可避免数千例误诊;其次,为资源匮乏地区提供了可靠的自动诊断方案;最后,揭示的肾结石检测难点为后续研究指明方向。作者建议未来整合目标检测技术以优化结石识别,这一成果已发表在《Franklin Open》,为医学影像分析设立了新基准。

(1
shifted window自注意力:SwinT创新的注意力计算方式,通过重叠窗口划分实现全局信息交互,相比传统Transformer降低计算复杂度)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号