基于可解释深度学习的心电图心律失常预测框架:ECG-CNNTX模型在PVC检测中的创新应用
《IEEE Access》:Design of an Explainable Deep Learning Framework for ECG-Based Arrhythmia Prediction
【字体:
大
中
小
】
时间:2025年12月04日
来源:IEEE Access 3.6
编辑推荐:
本研究针对心电图(ECG)心律失常人工诊断效率低、易出错的问题,开发了一种将ECG信号转化为二维图像并结合EfficientNetB0与Transformer的混合深度学习框架ECG-CNNTX。该模型在MIT-BIH数据库的PVC检测中达到99%的准确率,并通过Grad-CAM实现可视化解释,为临床提供高精度、可解释的自动化诊断方案。
心血管疾病是全球首要死因,其中心律失常是导致心源性猝死的重要诱因。传统心电图分析依赖专业医师肉眼判读,不仅耗时耗力,还存在观察者间差异。尽管机器学习技术已应用于心律失常自动检测,但现有模型往往存在泛化能力不足、可解释性差等瓶颈,特别是对心室早搏(PVC)这类特定心律失常的识别精度仍有提升空间。
为解决这一临床痛点,印度韦洛尔理工大学的Deepika Tenepalli与T. M. Navamani在《IEEE Access》发表研究,提出了一种创新性的可解释深度学习框架。该研究突破传统一维信号处理思路,将ECG信号转化为二维波形图像,并构建了结合EfficientNetB0卷积神经网络与Transformer注意力机制的混合模型(ECG-CNNTX),在PVC检测中实现了99%的准确率,同时通过梯度加权类激活映射(Grad-CAM)技术提供决策可视化,极大提升了模型的临床可信度。
研究团队采用的核心技术方法包括:基于WFDB库的ECG信号分割与标注、Butterworth带通滤波(0.5-40 Hz)去噪处理、Matplotlib波形图像生成(224×224像素)、EfficientNetB0特征提取与Transformer全局上下文建模的混合架构,以及Grad-CAM可解释性分析。实验数据来源于MIT-BIH心律失常数据库的48条记录,包含112,559张ECG图像(正常类105,430张,PVC类7,129张),按8:2比例划分训练集与测试集。
ECG-CNNTX模型采用双分支结构:EfficientNetB0主干网络负责提取局部波形特征(如QRS波群形态),Transformer模块则通过自注意力机制捕捉全局时空依赖关系。该设计有效解决了传统CNN模型感受野有限的问题,同时避免了纯Transformer模型参数量过大的缺陷。模型最终通过Sigmoid激活函数输出PVC概率预测,并采用二元交叉熵损失函数进行优化。
在超参数优化(学习率1e-3~1e-4、Dropout率0.3-0.5)后,模型在测试集上准确率达99.01%,精确度98.90%,召回率99.00%,F1分数98.95%,AUC-ROC值0.997。消融实验表明,单独使用EfficientNetB0或Transformer仅能获得95.23%和94.12%的准确率,验证了混合架构的协同优势。
Grad-CAM热力图显示模型决策主要聚焦于QRS复合波区域,与临床诊断依据高度吻合。这种可视化解释机制使医生能够直观理解模型判断依据,显著增强了对AI决策的信任度。
该研究通过创新的"信号-图像"转换策略和混合深度学习架构,成功解决了ECG心律失常检测中的精度与可解释性难以兼顾的难题。相比传统方法,ECG-CNNTX不仅实现了最先进的检测性能,更开创了临床可理解的AI辅助诊断新模式。研究指出的未来方向——包括多中心验证、多导联扩展模型压缩等——将为深度学习在心血管疾病诊断中的实际应用铺平道路。这种将先进AI技术与临床需求紧密结合的研究范式,对推动智慧医疗发展具有重要示范意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号