
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度集成学习的CT图像慢性肾病检测优化研究:Swin Transformer与卷积神经网络的协同创新
【字体: 大 中 小 】 时间:2025年06月09日 来源:Franklin Open
编辑推荐:
针对慢性肾病(CKD)早期诊断准确率不足的临床挑战,本研究创新性地整合Swin Transformer、CCT等视觉Transformer与VGG16、Inception-v3等卷积神经网络,构建加权集成模型。通过分析12,446例CT图像,实现99.67%的总体准确率,较基线模型提升0.15%,特别在肾结石检测(F1 score=0.989)方面取得突破,为LI-LMIC地区(低收入和中等收入国家)的智能诊断系统开发提供新范式。
慢性肾病(CKD)已成为全球公共卫生的重大威胁,预计到2040年将成为全球第五大致命疾病。在低收入和中等收入国家(LI-LMIC),医疗资源匮乏与专业肾病医师短缺使得早期诊断尤为困难。传统CT影像诊断依赖医师经验,而现有AI模型在肾结石等复杂病变识别上仍存在显著误诊风险。Wang等研究者曾报道CNN模型对肾结石检测准确率仅94.7%,Abraham等改进至98%,但临床需求仍呼唤更高精度的解决方案。
为突破这一技术瓶颈,研究人员开展了一项开创性研究,通过集成前沿的视觉Transformer与卷积神经网络架构,构建了两种创新性集成模型:Inception-v3-CCT-SwinT(集成组1)和VGG16-EANet-ResNet50(集成组2)。研究团队采用包含12,446例CT图像的数据集,涵盖肾囊肿(3,709例)、肾结石(1,377例)、肾肿瘤(2,283例)和健康肾脏(5,077例)四类样本,图像分辨率分别适配不同模型需求(168×168至299×299像素)。通过数据增强技术(随机旋转15°、缩放0.2倍率、垂直/水平翻转)有效平衡了数据集。
关键技术方法包括:1)采用六种基线模型(SwinT、CCT、VGG16、Inception-v3、EANet、ResNet50)建立性能基准;2)设计并行集成架构,应用软投票(soft voting)和加权软投票决策融合策略;3)引入外部注意力机制(EANet)和残差连接(ResNet50)等创新结构;4)通过混淆矩阵、精确度(P)、召回率(R)和F1
score等指标全面评估性能。
研究结果部分显示,基线实验中Swin Transformer以99.52%的准确率领先,对肾囊肿的召回率达100%,但肾结石识别仍存在2.2%的漏诊。集成模型表现更为突出:
研究结论指出,这种集成策略在医疗诊断领域具有重要价值:首先,0.15%的精度提升在临床场景中意味着每年可避免数千例误诊;其次,为资源匮乏地区提供了可靠的自动诊断方案;最后,揭示的肾结石检测难点为后续研究指明方向。作者建议未来整合目标检测技术以优化结石识别,这一成果已发表在《Franklin Open》,为医学影像分析设立了新基准。
(1
shifted window自注意力:SwinT创新的注意力计算方式,通过重叠窗口划分实现全局信息交互,相比传统Transformer降低计算复杂度)
生物通微信公众号
知名企业招聘