编辑推荐:
研究人员针对肺部疾病诊断难题,开展胸部 X 光片深度学习分类研究,模型精度高,助力医疗诊断。
# 深度学习在胸部 X 光片诊断中的创新突破:精准识别肺部疾病
在全球范围内,肺部疾病始终是威胁人类健康的重要因素。自 2019 年底
COVID-19 疫情爆发以来,其迅速蔓延给世界带来了巨大挑战。截至 2023 年 12 月,全球确诊病例高达 772,386,069 例,死亡人数达 6,987,222 例。COVID-19 不仅症状多样,如发热、干咳、呼吸急促等,还可能引发严重的并发症,像心力衰竭、肺炎等,而这些正是导致患者死亡的主要原因。
目前,COVID-19 的诊断金标准是逆转录聚合酶链反应(RT-PCR),但它存在检测时间长(最长可达 2 天)、灵敏度低(约 60 - 70%)以及假阴性率高等问题。计算机断层扫描(CT)和胸部 X 光片(CXR)等影像学技术成为了替代方案。然而,CT 也有诸多弊端,比如设备不可移动,存在病毒传播风险;辐射剂量高;成本高昂且对操作人员专业要求高,在农村地区难以普及。相比之下,CXR 具有成本低、辐射剂量小、筛查速度快等优点,在肺部疾病的早期诊断中发挥着关键作用。
但 CXR 也并非完美无缺。由于解剖结构和组织结构在投影方向上存在重叠,解读 CXR 图像对医生的技能和经验要求极高。而且,大量的 CXR 图像增加了医生的工作量,容易导致误诊,据估计,放射科医生在日常工作中的 “实时” 误诊率平均为 3 - 5%。为了解决这些问题,来自土耳其巴斯肯大学(Baskent University)、哈杰泰佩大学(Hacettepe University)的研究人员 Burcu Oltu、Selda Güney 等人开展了一项研究,相关成果发表在《BMC Medical Imaging》杂志上。
研究人员提出了一种基于注意力机制的端到端深度学习(DL)网络,该网络结合了视觉 Transformer(ViT)和 DenseNet201,旨在实现对 COVID-19、肺不透明(Lung Opacity)、病毒性肺炎(Viral Pneumonia)和正常胸部 X 光片的准确分类。
在技术方法上,研究人员使用了开源的 COVID-19 Radiography Database 数据集,该数据集包含 COVID-19、病毒性肺炎、肺不透明和正常四类图像,共计 21,165 张。为了评估模型性能,研究采用了五折交叉验证的方法。在模型构建方面,以预训练的 DenseNet201 为基础进行特征提取,其包含 201 个卷积层,能有效提取空间特征。同时,将 ViT 引入模型,利用其注意力机制捕捉长距离依赖关系。此外,通过全局平均池化(GAP)增强特征表示,减少维度并保留关键空间信息。最终构建的模型在 Google Colab Pro 平台上,基于 TensorFlow 框架进行训练和测试。
研究结果主要包括以下几个方面:
分类结果优异 :模型在各类疾病的检测中表现出色。在五折交叉验证中,整体准确率高达 97.87%。其中,COVID-19 的检测准确率为 99.44%,精确率为 99.24%;肺不透明的准确率为 96.45%;病毒性肺炎的准确率为 99.63%;正常病例的准确率为 95.97%。从混淆矩阵和受试者工作特征曲线(ROC)来看,模型对 COVID-19 和病毒性肺炎的分类误差极小,COVID-19 和病毒性肺炎在每折交叉验证中的 AUC 均达到 1.0,肺不透明和正常病例的 AUC 为 0.99。不过,正常和肺不透明的 CXRs 有时会出现混淆,可能是因为轻度肺不透明的图像与正常图像相似,且数据集缺乏病理学严重程度信息。
模型可解释性增强 :为了提高模型的可解释性,研究人员使用了梯度加权类激活映射(Grad-CAM)算法。该算法通过突出模型在做出预测时关注的图像区域,直观展示了模型的决策过程。例如,在不同类别的 CXR 图像上,Grad-CAM 生成的热图能够清晰显示出模型重点关注的区域,帮助研究人员理解模型如何识别不同疾病。
消融研究验证有效性 :通过消融研究评估模型各组件的贡献。结果表明,单独使用 ViT 时,准确率为 94.20%;单独使用 DenseNet201 时,准确率为 97.52%;将 DenseNet201 和 ViT 结合但不使用 GAP 时,准确率提升至 97.53%。而最终提出的包含 DenseNet201、ViT 和 GAP 的模型,在各项指标上都有显著提升,准确率达到 97.87%,充分证明了该模型的有效性和优越性。
研究结论和讨论部分指出,该研究提出的 DL 框架在区分 COVID-19、肺不透明、病毒性肺炎和正常 CXRs 方面表现卓越,优于以往许多研究成果。但研究也存在一定局限性,如公开数据集可能无法完全反映真实临床场景的多样性,模型在实际应用中可能面临成像条件、扫描仪设置和患者人口统计学差异等挑战。未来研究计划通过增加训练数据量、使用更复杂的分类任务、采用多中心临床数据集验证等方式,进一步提升模型性能,开发更强大的决策支持系统,为临床诊断提供更可靠的帮助,减轻临床医生的工作负担,提高诊断准确性。
鎵撹祻
涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒
10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�
娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功
鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�
涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�