基于时空自监督学习的心电图特征提取新方法:突破标注数据限制的心血管疾病诊断创新

【字体: 时间:2025年02月20日 来源:Scientific Reports 3.8

编辑推荐:

   为解决心电图(ECG)信号标注数据稀缺导致的深度学习模型性能瓶颈问题,Wenping Chen团队提出时空自监督学习(TSSL)方法,通过挖掘ECG信号的时空特性(如时间不变性和多导联空间相关性),在CPSC2018等三大数据库验证中仅需10%标注数据即达到全监督训练性能。该研究为心血管疾病的无创诊断提供了高效特征提取新范式,代码已开源。

  

心血管疾病是全球首要死因,而心电图(ECG)作为诊断金标准却面临两大挑战:专业医生解读耗时且易疲劳,传统深度学习依赖大量标注数据但医疗标注成本极高。现有自监督方法多聚焦图像领域,忽视ECG特有的时空特性——同一患者不同时间的心电波形具有身份一致性(时间不变性),而12导联信号既存在空间关联又各具诊断价值(如V1导联对右束支阻滞的特异性)。如何利用这些特性突破数据标注限制,成为提升自动诊断精度的关键。

河海大学信息科学与工程学院联合赣南科技学院的研究团队在《Scientific Reports》发表研究,提出时空自监督学习框架TSSL。该方法创新性地将时间维度(同一患者同导联信号跨时间一致性)与空间维度(多导联间生理关联)解耦设计:时间自监督通过对比学习隔离导联特征,空间自监督则用均方误差保持导联间相关性。实验表明,TSSL在CPSC2018等三大公开数据库上仅用10%标注数据即逼近全监督模型性能,尤其在复杂心律失常分类任务中ROC值提升超15%。

研究采用四大经典CNN架构(LeNet、AlexNet、VGG、ResNet)作为编码器,通过分段处理10秒12导联ECG信号(采样率500Hz,统一长度4096点)。关键技术包括:1)无监督预训练阶段采用NT-Xent损失函数优化正负样本对(正对:同患者同导联信号;负对:不同患者同导联信号);2)空间相关性约束通过计算原始信号与特征投影的余弦相似度差异实现;3)下游任务评估采用线性评估(冻结编码器)与微调评估两种模式。

Temporal Self-Supervised Learning
通过导联隔离策略,模型在ECG-ID数据库验证发现:即使间隔8个月的同一患者ECG仍保持形态相似性(余弦相似度>0.85)。相比传统方法(如CLOCS将不同导联视为相同实例),TSSL使LeNet在PTB-XL数据集分类AUC提升至0.857±0.008。

Spatial Self-Supervised Learning
分析导联间相关性发现:II导联与aVR导联的原始信号相似度为0.32,而TSSL提取的特征相似度偏差仅0.05,显著优于单用时间监督的方法(偏差达0.18)。这种特性使VGG模型在诊断后壁心肌梗死时,关键导联V7-V9的特征区分度提升21%。

Ablation Analysis
消融实验证实时空联合监督的协同效应:单独使用空间监督(SSL)在CPSC2018数据集仅获0.753 AUC,而结合时间监督(TSSL)后提升至0.851。可视化显示,TSSL保留的导联间差异模式与临床指南一致(如心房颤动特征在I导联最显著)。

Label Efficiency
标注效率实验揭示:在Chapman数据集,TSSL仅需1%标注量(约64例)即达到全监督模型98.4%性能;对于更复杂的PTB-XL多标签分类任务,10%标注量可使ResNet模型AUC达0.872±0.009,超越全监督基线0.858。

该研究开创性地将医学先验知识融入自监督学习设计:时间维度对应心脏电生理稳定性,空间维度反映向量心电图(VCG)投影特性。相比依赖数据增强的SimCLR框架,TSSL无需人工变换即可提取具有临床解释性的特征(如R波振幅变化率与QT间期的跨导联关联)。局限性在于当前仅验证固定时长ECG片段,未来需拓展至动态长程监测。研究团队已开源代码,该方法可扩展至脑电图等多导联生理信号分析,为智慧医疗提供新工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号