基于可解释深度学习的心律失常检测框架:提升ECG信号分析的准确性与临床可信度

《Scientific Reports》:An explainable deep learning framework for trustworthy arrhythmia detection from ECG signals

【字体: 时间:2025年11月13日 来源:Scientific Reports 3.9

编辑推荐:

  为解决心电图(ECG)信号分析中深度学习模型缺乏可解释性、易过拟合及类别不平衡等问题,研究人员开展了心律失常检测的可解释人工智能(XAI)研究。该研究集成CNN与DNN架构,结合ROS数据平衡技术,在MITDB、PTBDB和NSTDB数据集上分别达到99.74%、99.43%和99.98%的准确率,并引入SHAP、LIME和FIA等XAI方法提供决策透明度,显著提升了AI驱动心血管诊断的可靠性和临床适用性。

  
心血管疾病(CVDs)是全球健康的首要挑战,每年导致约1790万人死亡,占全球总死亡人数的32%。其中,心律失常如心室扑动和心室颤动与心血管疾病的发生密切相关,可能引发猝死、血流动力学崩溃和心脏骤停等严重事件。心电图(ECG)作为非侵入性诊断工具,通过记录心脏电活动(包括P波、QRS复合波和T波)来监测心脏健康和识别心血管异常。然而,ECG数据量大、特征多样且受试者间变异性高,使其准确分析和解读变得复杂。
传统ECG监测方法(如Holter监测、遥测和事件监测仪)面临诊断延迟、依赖患者合规性及限于临床环境等挑战。尽管可穿戴ECG设备提高了监测便利性,传统系统仍难以处理患者和环境间的ECG信号变异性。植入式设备可连续监测心律失常,但具有侵入性,并非适用于所有患者。近年来,深度学习(DL)技术,特别是卷积神经网络(CNN)和深度神经网络(DNN),为应对这些挑战提供了强大途径。这些模型擅长处理复杂高维数据,捕捉ECG信号中的细微时间模式,并通过自动从原始数据中提取有意义的特征,显著提高了心律失常检测和分类的诊断准确性。
然而,深度学习模型在ECG分析中仍存在泛化性和鲁棒性不足的问题。许多模型在特定数据集上容易过拟合,影响其在多样或未见ECG数据上的表现,这是实际应用中的关键问题。噪声消除技术虽有所改进,但其在不同类型噪声和信号失真下的泛化能力仍有限。传统方法常无法有效处理多源噪声,而深度学习模型在噪声环境中仍面临限制。此外,高级DL模型(如混合LSTM-CNN)的计算复杂度高,需要大量计算资源,使其难以在资源受限设备(如移动或可穿戴ECG监测仪)上实现实时应用。数据集平衡技术如SMOTE(合成少数过采样技术)有助于缓解类别不平衡,但有时引入的合成数据可能无法准确反映真实世界变异,导致模型预测偏差。特征提取是另一个挑战领域,现有技术可能无法一致地从复杂ECG信号中识别最相关特征,导致遗漏对准确心律失常检测至关重要的关键模式。最后,DL模型的黑盒特性限制了其透明度,这种可解释性缺乏是临床采纳的重要障碍,因为医疗专业人员需要理解模型的决策过程才能信任并将其用于患者护理。
为克服这些局限性,本研究引入了一种新颖的可解释深度学习框架,用于从ECG信号中准确可靠地检测心律失常。该框架集成了尖端DL模型(CNN和DNN),采用多阶段流程,包括精细的数据准备、先进的信号预处理和鲁棒的多策略数据平衡技术(如ADASYN、SMOTE、SMOTETomek和随机过采样(ROS)),以最大化模型性能和泛化能力。关键的是,框架融合了可解释人工智能(XAI)方法——即SHAP、LIME和特征重要性分析(FIA)——以提供对模型决策过程的透明洞察。在基准ECG数据集(如MITDB、PTBDB和NSTDB)上的严格评估展示了卓越的分类准确性,其中ROS+CNN模型分别实现了99.74%、99.43%和99.98%的准确率。嵌入的XAI组件提供了可操作的 interpretability,促进临床信任,并为更可靠和有影响力的AI驱动心血管诊断铺平道路。
研究方法上,作者利用WFDB Python库动态加载来自MITDB、PTBDB和NSTDB的原始ECG信号及相应心跳注释,通过1秒窗口围绕R峰提取信号段,应用Butterworth带通滤波(0.5-45 Hz)、50 Hz陷波滤波和高通滤波进行信号预处理,再通过Z-score标准化归一化。为处理类别不平衡,采用了ADASYN、SMOTE、SMOTETomek和ROS等数据平衡技术。深度学习模型方面,CNN架构包含两个一维卷积层(128和64过滤器)、最大池化层和全连接层,而DNN由三个密集层(128、64和32神经元)组成,两者均使用ReLU激活函数、Dropout正则化和Sigmoid输出层,以Adam优化器和二元交叉熵损失进行训练,并采用早停策略防止过拟合。模型评估指标包括准确率、精确度、召回率、F1分数、AUC、MCC、Cohen's Kappa及误差指标(MAE、MSE、RMSE)。可解释性分析通过SHAP、LIME和FIA实现,以揭示模型决策的关键特征。
数据准备与预处理
研究使用三个基准ECG数据集:MIT-BIH心律失常数据库(MITDB)、噪声应激测试数据库(NSTDB)和PTB诊断ECG数据库(PTBDB)。MITDB包含47名受试者的48条双通道动态ECG记录,采样率360 Hz,提供丰富的心跳形态变体。NSTDB虽无心律失常注释,但提供合成噪声(如基线漂移、肌肉伪影和电极运动),用于测试模型在噪声条件下的鲁棒性。PTBDB包含290名患者的高分辨率ECG记录(采样率1000 Hz,降采样至360 Hz),涵盖多种心脏条件,用于增强训练数据和验证泛化能力。数据准备阶段通过动态加载、1秒窗口提取和并行处理高效生成统一数据集,预处理包括带通滤波、陷波滤波、基线漂移去除和Z-score标准化,显著提升信号质量。
数据平衡技术比较
为应对ECG数据中的类别不平衡,研究比较了ADASYN、SMOTE、SMOTETomek和ROS四种平衡技术。在MITDB上,ROS+CNN组合表现最佳,达到99.74%的准确率和99.98%的AUC,误差指标最低(MAE 0.31, RMSE 4.78)。其他技术也显示强劲性能,但ROS consistently提供略微优势,特别是在CNN架构中。DNN模型同样表现鲁棒,最佳准确率为99.60%(与ROS结合)。结果表明ROS是缓解类别不平衡的最有效策略,从而实现了高度准确和可靠的心律失常检测。
深度学习模型性能
在MITDB数据集上,CNN模型与ROS结合 achieved the highest accuracy of 99.74%, precision of 99.75%, recall of 99.73%, and F1-score of 99.74%. The AUC reached 99.98%, with MCC and Cohen's Kappa both at 99.48%. The DNN model also performed strongly, with accuracy up to 99.60%. On the PTBDB dataset, the CNN with ROS achieved 99.43% accuracy, 99.57% precision, and 99.98% AUC, while the DNN showed lower performance (accuracy 96.17%). For the NSTDB dataset, the CNN with ROS attained near-perfect results: 99.98% accuracy, 100.00% TPR, and 100.00% AUC, demonstrating exceptional robustness under noisy conditions. The CNN consistently outperformed the DNN due to its ability to capture spatial-temporal features in ECG signals through convolutional layers.
可解释性分析
通过SHAP、LIME和FIA技术,研究提供了模型决策的透明洞察。在MITDB上,FIA识别出Time_2、Time_33和Time_34等特征为关键贡献者。SHAP分析显示了这些特征对心律失常和正常类别的正面或负面影响,而LIME提供了局部解释,突出特定波形区间(如QRS复合波)的重要性。在PTBDB和NSTDB上,类似分析揭示了Time_34、Time_35、Time_367和Time_369等特征的主导作用,增强了临床信任和模型可靠性。
优化器与平衡策略的消融研究
消融研究比较了Adagrad、Adam、Adamax和RMSprop优化器,发现Adam在PTBDB上表现最佳,CNN准确率达99.43%,误差最低(MAE 0.92, RMSE 6.56)。因此,Adam被选为后续实验的优化器。在数据平衡方面,ROS consistently outperformed GAN-based methods, with ROS+CNN achieving significantly higher accuracy (99.43% vs. 85.84% for GAN+CNN on PTBDB) and lower errors, confirming ROS as a more effective strategy for arrhythmia detection.
计算效率分析
计算时间分析显示,CNN模型在MITDB上的训练时间为399.249秒,预测时间为5.422秒;在NSTDB上,训练时间减少至87.336秒,预测时间为1.367秒;在PTBDB上,训练时间为67.986秒,预测时间为0.800秒。DNN模型训练时间较长,但预测时间相近。结果表明CNN架构在准确性和计算成本间提供了 practical balance,适合实时临床部署。
研究结论表明,该可解释深度学习框架在心律失常检测中实现了卓越的准确性和鲁棒性,通过集成先进DL模型、多策略数据平衡和XAI技术,有效解决了类别不平衡、噪声敏感性和模型透明度等问题。在三个基准数据集上的综合验证证明了其泛化能力和临床适用性。未来工作将聚焦于特征融合和Transformer架构的集成,以进一步增强模型性能,并探索实时边缘设备部署和多模态数据融合,以支持更全面的心血管诊断。该研究为AI驱动医疗工具的实际应用提供了重要推动,通过结合高性能和可解释性,促进了临床信任和广泛采纳。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号