肺结核,这个由结核分枝杆菌(Mycobacterium tuberculosis)引发的疾病,如同隐匿在暗处的 “健康杀手”。近年来,它已成为全球公共卫生领域的重大挑战,仅次于新冠疫情带来的影响。据世界卫生组织(WHO)数据,2019 年全球约有 140 万人因肺结核失去生命。肺结核虽可防可治,但由于受社会经济因素、医疗资源分配不均以及与艾滋病(HIV)共感染等问题影响,其检测和诊断困难重重。在医学影像诊断中,从胸部 X 光片准确判断肺结核是关键环节。然而,肺结核早期在 X 光片上的表现十分隐匿,传统的依靠放射科医生手动识别结节、浸润等特征的方法,不仅依赖医生经验,而且效率较低。随着技术发展,基于机器学习和深度学习的计算机化系统逐渐兴起。早期的边缘检测、支持向量机和决策树等算法,需要人工设计特征,性能波动较大。卷积神经网络(Convolutional Neural Networks,CNNs)的出现虽有进步,但仍需大量标注数据,且在不同临床环境中的泛化能力欠佳。
为了攻克这些难题,来自印度和埃塞俄比亚等多个机构的研究人员展开了深入研究。他们将研究成果发表在《BMC Medical Imaging》上。这项研究旨在利用视觉 Transformer(Vision Transformer,ViT)结合梯度加权类激活映射(Gradient-weighted Class Activation Mapping,Grad-CAM)技术,构建一个精准且具有可解释性的肺结核检测模型,提升从胸部 X 光片诊断肺结核的准确性,同时增强模型决策的可解释性,为临床诊断提供有力支持。