解锁 AI “心电密码”:12 导联 ECG 图像可解释性工具为心脏诊断 “破局”

【字体: 时间:2025年02月19日 来源:npj Digital Medicine 12.4

编辑推荐:

  为解决 AI 分析 12 导联 ECG 图像时模型推荐可解释性有限的问题,研究人员开展 12 导联 ECG 图像 AI 模型可解释性工具的研究。结果显示该工具效果良好,能助力心脏疾病诊断。推荐科研读者阅读,了解 AI 在医疗领域的创新进展。

  
在医疗领域,12 导联心电图(12-lead electrocardiography,ECG)是检测心脏形态和心律失常状况的重要临床工具。在美国,2020 年急诊室超 3200 万次、社区健康中心 4700 万次的心电图检查,足见其应用之广泛。随着人工智能(AI)技术发展,利用 12 导联 ECG 图像进行心脏疾病自动分类的算法不断涌现,准确率颇高。但这些 AI 工具在临床应用中却遭遇了瓶颈。

原来,尽管 AI 分类准确,可模型输出的结果却难以让医生理解。想象一下,医生面对一个给出诊断结果却无法解释原因的 “黑匣子”,怎么能放心使用呢?缺乏对模型结果的直观理解,医生很难建立起对这些工具的信任,这严重阻碍了 AI 在临床实践中的应用。而且,由于缺乏对心脏疾病生物标志物的共识,不同的解释方法也存在诸多问题。像早期一些方法直接在信号上操作,需要信号提取,不仅麻烦还容易引入误差;后来的 GRAD-CAM 虽用高质量扫描图像,可突出的特征却常与诊断标准不符,还容易忽略小的临床特征,缺乏特异性。

为了解决这些难题,[第一作者单位] 的研究人员在《Nature Communications》期刊上发表了题为 “High-resolution interpretability for deep learning analysis of 12-lead electrocardiograms” 的论文。他们成功开发出一种通用的临床资源可解释性工具,为分析数字化 12 导联 ECG 图像的 AI 模型提供支持,这一成果意义重大,有望推动 AI 在心脏疾病诊断领域的广泛应用,让 AI 真正成为医生的得力助手。

研究人员在这项研究中用到了几个关键技术方法。他们基于雅可比矩阵(Jacobian matrix)的敏感性,计算分类器对每个像素的梯度,以此实现医学相关的可解释性。同时,构建了 ECG-AIO 神经网络模型,该模型采用域对抗训练等迁移学习方法,包含联合特征提取器、信号解码器、标签预测器和域分类器等组件。通过多阶段的训练过程,让模型不断优化,以适应不同的图像数据。

下面来看看具体的研究结果。

  • 总体实验概述:研究人员开展了三组实验。第一组在高质量扫描的纽约大学(NYU)标记数据集(DB1)上测试,结果显示该方法在高质量扫描图像上表现出色,能精准地突出临床相关特征。第二组实验则是在添加了阴影和伪影的 NYU 标记数据集(DB2)上进行,由于图像与训练集分布不同,网络性能和可解释性结果都受到了影响。为了解决这个问题,研究人员在网络中加入了信号解码器,这个 “小助手” 能从图像中提取信号,减少信息损失。第三组实验用智能手机拍摄的临床图像数据集(DB3)进行测试,虽然信号解码器有一定帮助,但因训练数据有限,结果仍不理想。于是,研究人员又采用域对抗训练,添加域分类器,让网络学习与域无关的特征,最终得到的 ECG-AIO 模型在拍摄图像上的性能与扫描图像相当。
  • 高质量扫描标记 NYU 数据集的可解释性:在 DB1 数据集上,研究人员可视化了模型的可解释性。结果令人惊喜,紫色的可解释性标记精准地覆盖在原始 12 导联 ECG 图像上,突出了各种心脏疾病诊断所需的关键特征。比如在诊断心房颤动时,模型强调了 P 波位置周围的信号基线,还标注出不规则的 R 波峰值,这和临床诊断标准完全吻合;诊断左束支传导阻滞时,模型突出了宽 QRS 波群等特征,这些都是医生在临床诊断中重点关注的。
  • 含阴影和伪影标记 NYU 数据集的可解释性:当面对含有阴影和伪影的 DB2 数据集时,模型最初出现了一些问题,比如在部分情况下忽略了阴影,对某些疾病的解释也出现错误。但添加信号解码器后,情况有了很大改善。以心房颤动为例,无论是图像的明亮区域还是阴影区域,模型都能准确地突出 P 波位置周围的信号基线,强调 P 波缺失和不规则的节律。
  • 临床智能手机拍摄图像的可解释性:在 DB3 数据集上,最初模型对拍摄图像的可解释性存在模糊之处,标记容易出现在背景而非信号上。不过经过改进,采用域对抗训练等方法后,模型的表现大幅提升。以心房扑动为例,模型能清晰地突出许多信号中的 “锯齿” 样扑动波;对于左束支传导阻滞,模型也能强调出符合诊断标准的长 QRS 波群。而且,改进后的模型分类准确率也很高。研究人员还进行了一系列测试,比如定义真阳性、真阴性等指标,选择不同类型的图像进行对比,结果都证明了模型的可靠性和鲁棒性。
  • 特定心脏疾病不存在的可解释性:这项研究的可解释性方法还有一个厉害之处,它不仅能解释疾病存在的情况,还能解释疾病不存在的情况。研究人员以一张没有心房颤动迹象的心电图为例,模型准确地突出了每个 QRS 波群前的 P 波,从而证实了没有心房颤动。
  • 所提可解释性工具的通用性:为了证明该方法的通用性,研究人员用 ResNet18 替换了 ECG-AIO 网络中的编码器,在相同记录上测试,结果发现突出的特征相似。而且,用这个改进后的网络对更多心脏疾病进行测试,比如一度房室传导阻滞、心肌梗死等,模型都能准确地突出相关的临床特征。和 GRAD-CAM 方法相比,该方法生成的结果分辨率更高,更能聚焦于关键特征。
  • 不同格式下可解释性的临床评估:研究人员分析了不同格式下的心电图记录,发现该算法能一致地突出相关临床特征,不受心电图导联绘制格式的影响。和 GRAD-CAM 对比,该方法突出的特征更清晰。在对 12 导联 ECG 信号进行分析时,算法在渲染的数字向量上也表现良好。
  • 可解释性准确性的临床评估:研究人员将算法的可解释性与 3 位电生理学家的解释进行比较,重点关注心房扑动和室性早搏这两种疾病。结果显示,算法与专家解释的相关性系数很高,分别达到 0.96±0.1 和 0.94±0.03,这表明算法在捕捉和解释这些疾病特征方面与专家高度一致,可靠性很强。

综合来看,这项研究成果显著。它成功展示了一种通用方法在提供 12 导联 ECG 图像可解释性方面的有效性,能为形态学和心律失常性心脏疾病提供可解释性,还能帮助医生判断某些疾病的不存在,增强了医生对 AI 系统的信任。不过,研究也存在一些局限性。比如方法仅依赖每个像素的偏导数,可能会忽略 ECG 模式的内在特征和相邻像素间的关系;可解释性方法的准确性与网络分辨率直接相关,对于复杂特征的解释能力有限;该方法不适合有记忆的网络,而且网络选择检测的临床属性无法控制,影响解释性;此外,系统的准确性还受数据采样的影响,过度依赖 AI 也可能削弱临床医生的专业技能。

尽管如此,这项研究为未来的研究指明了方向。随着网络接触的数据增多,其准确性和可解释性也会提高。基于智能手机的 ECG 可解释性工具潜力巨大,有望改变远程心电监测的现状,但在诊断准确性、法规合规性、数据安全和患者教育等方面还需进一步完善。未来的临床研究可以进一步评估可解释性工具在实际诊断过程中的影响,比如对比有可解释性工具和没有可解释性工具时医生的诊断决策,从而更好地推动 AI 在心脏疾病诊断中的应用,为患者带来更准确、高效的医疗服务。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号