编辑推荐:
为解决 DWI-FLAIR 失配视觉评估的局限性问题,蔚山科学技术院等机构研究人员开展基于深度学习分类器的研究。结果显示该分类器性能良好,能减少主观性。推荐阅读,助您了解脑卒中诊疗新技术。
在急性缺血性脑卒中的治疗领域,时间就是大脑,如何精准地筛选出能从再通治疗中获益的患者,一直是医学研究的重要课题。扩散加权成像(DWI)和液体衰减反转恢复(FLAIR)成像技术的出现,为这一难题带来了新的希望。当 DWI 和 FLAIR 成像出现不匹配(DWI-FLAIR mismatch)时,意味着可能存在可挽救的脑组织,这一特征对判断患者是否适合再通治疗意义重大。
然而,理想很丰满,现实却很骨感。目前在评估 DWI-FLAIR 不匹配时,主要依靠医生的肉眼观察,这就好比让不同的人去欣赏同一幅抽象画,每个人的理解和感受都不一样。不同医生之间的判断差异很大,这严重影响了评估的准确性和一致性,就像一把刻度不准的尺子,怎么能准确测量长度呢?这种主观性很强的评估方式,就像在迷雾中摸索,让医生难以做出精准的治疗决策。为了打破这一困境,让急性缺血性脑卒中的治疗更加精准高效,来自蔚山科学技术院人工智能研究生院等多个机构的研究人员踏上了探索之旅。他们的研究成果发表在《Scientific Reports》期刊上,论文题目是 “Deep learning-based classification of diffusion-weighted imaging-fluid-attenuated inversion recovery mismatch”。研究发现,基于深度学习的分类器能够有效减少评估 DWI-FLAIR 不匹配时的主观性,为医生在急性脑卒中治疗中做出更有针对性的决策提供有力支持。这一成果就像是给在迷雾中前行的医生们点亮了一盏明灯,为急性缺血性脑卒中的治疗带来了新的曙光。
为了实现这一突破,研究人员运用了多种关键技术方法。他们从四个脑卒中中心筛选了连续的急性缺血性脑卒中患者,这些患者都接受了 DWI 和 FLAIR 成像检查。在数据处理阶段,研究人员对所有图像进行了归一化、插值和配准等预处理操作,就像是给图像进行了一次 “整容”,让它们变得更加整齐规范,便于后续分析。在分类模型构建方面,研究人员基于 3D 卷积神经网络架构,针对两种不同的二元分类方案(Label Set I 和 Label Set II)开发了分类算法。最后,为了评估模型的性能,研究人员使用了受试者工作特征曲线(ROC)、计算 Brier 评分、生成校准图以及利用 Guided GradCAM 生成显著性图等方法,从不同角度对模型进行全面 “体检” ,确保模型的可靠性和有效性。
下面让我们深入了解一下这项研究的具体成果:
- 患者基本信息与数据标注情况:研究人员总共分析了来自推导队列的 3022 名患者和来自外部验证队列的 753 名患者的数据。经过仔细筛选,排除了不符合条件的病例后,最终用于模型开发和验证的推导队列有 2369 名患者,外部验证队列中,庆熙大学东山医院(KM)有 350 名患者,岭南大学医院(YN)有 329 名患者。在数据标注过程中,5 名脑卒中专家(包括 4 名神经介入专家和 1 名神经内科专家)对图像进行手动标注,最终标注结果的 Fleiss’ Kappa 值达到了 0.91,这表明专家们的标注一致性非常高,就像几个乐手在演奏同一首曲子时配合得天衣无缝。
- 模型性能表现:在评估模型区分 DWI-FLAIR 匹配和不匹配的能力时,研究人员发现,Label Set I 的内部测试集曲线下面积(AUC)为 0.862(95% CI:0.841 - 0.884) ,外部验证集(KM 和 YN)的 AUC 分别为 0.829(95% CI:0.785 - 0.873)和 0.835(95% CI:0.790 - 0.879);Label Set II 的表现更为出色,内部测试集 AUC 达到 0.934(95% CI:0.911 - 0.957) ,外部验证集(KM 和 YN)的 AUC 分别为 0.883(95% CI:0.829 - 0.938)和 0.913(95% CI:0.876 - 0.951)。而且,各个数据集之间的模型性能没有显著差异,这说明该模型具有较好的稳定性,就像一辆性能稳定的汽车,无论在什么路况下都能平稳行驶。此外,模型校准结果显示,预测概率和实际概率之间的差异很小,Brier 评分也表明模型预测可靠,这就好比天气预报员每次预报的准确率都很高,让人可以放心地根据预报安排出行。
- 模型可解释性分析:为了弄清楚模型是如何做出决策的,研究人员利用 Guided GradCAM 生成了显著性图。结果发现,在匹配病例和不匹配病例中,模型的激活模式截然不同。在匹配病例中,显著性图主要在 DWI 和 FLAIR 信号均为阳性的病变区域有集中激活;而在不匹配病例中,激活模式扩展到了 DWI 病变核心区域之外。这就好像模型在判断不匹配病例时,会 “扫视” 更广泛的区域,考虑更多的因素,为医生的诊断提供了更直观的视觉指导,让医生能更好地理解模型的判断依据。
综合研究结果和讨论部分,这项研究意义非凡。基于深度学习的 DWI-FLAIR 不匹配分类器,就像是一个智能助手,大大减少了评估过程中的人为主观性。与以往利用 DWI 和 FLAIR 成像预测脑卒中发作时间的研究不同,该研究直接以不匹配为结果进行分析,更能准确反映脑组织的状态,为医生提供了更有价值的决策依据。虽然研究存在一些局限性,比如不同机构的成像协议存在差异可能影响算法的准确性,人工标注的主观性难以完全消除,模型的临床获益还需要进一步验证等,但这并不影响其为急性缺血性脑卒中的治疗开辟新的道路。未来,随着研究的不断深入和技术的持续改进,这一分类器有望在临床实践中得到更广泛的应用,帮助医生更精准地识别能从再通治疗中获益的患者,提高急性缺血性脑卒中的治疗效果,为无数患者带来新的希望,让他们能更快地恢复健康,回归正常生活。