基于树状人工智能心电图的新型心房颤动表型挖掘:从电生理特征到风险分层

《npj Digital Medicine》:Deriving novel atrial fibrillation phenotypes using a tree-based artificial intelligence-enhanced electrocardiography approach

【字体: 时间:2025年12月05日 来源:npj Digital Medicine 15.1

编辑推荐:

  本研究针对传统心房颤动(AF)分型仅依赖心律失常时长、难以捕捉疾病异质性与预后差异的临床痛点,开发了一种结合变分自编码器(VAE)与树状降维(DDRTree)的无监督AI-ECG分析框架。通过对超110万份心电图的分析,研究成功识别出5个具有独特电生理特征、心脏结构改变及未来疾病风险的AF表型组,为AF的精准分型与个体化管理提供了创新工具。该成果发表于《npj Digital Medicine》。

  
心房颤动(Atrial Fibrillation, AF)是全球最常见的心律失常之一,其患病率持续攀升,显著增加卒中、心力衰竭(Heart Failure, HF)和死亡风险。临床上,AF传统上依据发作时长被分为阵发性、持续性、长程持续性和永久性等类型。然而,这种基于时间的分类方法难以充分反映AF背后复杂的电生理机制、结构重构以及患者预后的巨大异质性。越来越多的证据表明,AF是一种高度异质性的疾病,其发生发展受到遗传、环境和合并症等多种因素的共同影响。尽管现行指南已开始采纳更具进展性的分期模式,但如何超越简单的时长分类,深入揭示AF的内在表型差异,从而实现真正的个体化诊疗,仍是当前心血管领域面临的重大挑战。
以往的研究尝试运用机器学习聚类方法,依据患者的临床特征(如人口统计学、实验室指标和心血管病史)对AF患者进行分型。然而,这些方法往往忽略了心电图(Electrocardiogram, ECG)这一直接反映心脏电活动的关键信息。因此,所识别的集群是否真正对应于AF的特异性病理生理改变,抑或仅仅是泛心血管风险因素的体现,尚不明确。随着医疗数字化进程的加速,海量ECG数据的可及性为利用无监督学习方法挖掘AF特有的电生理差异提供了前所未有的机遇。
在此背景下,由Mehak Gurnani、Arunashis Sau和Fu Siong Ng等共同领导的研究团队在《npj Digital Medicine》上发表了最新研究成果。该研究创新性地提出了一种结合生成式人工智能与树状轨迹建模的无监督AI-ECG分析框架,旨在从超过110万份ECG中深度挖掘AF的异质性,并识别出具有临床意义的新型表型组。
为了开展这项研究,研究人员主要运用了几个关键技术方法。首先,他们利用来自美国Beth Israel Deaconess Medical Center (BIDMC) 队列的超过110万份心电图 median beat(中位数心跳)数据,训练了一个β-变分自编码器(β-VAE),以无监督的方式提取了51个最具代表性的ECG形态学潜在特征。其次,针对筛选出的20,291名独特AF患者的指数ECG,研究应用了DDRTree(Dimensionality Reduction via Learning a Tree)这一树状降维算法,将高维的ECG特征投射到一个二维的树状轨迹上,该算法最初为模拟单细胞分化轨迹而开发,能直观展示表型的连续演变。最后,研究利用英国生物银行(UK Biobank, UKB)队列的AF患者数据(2,344份ECG)对所构建的BIDMC AF DDRTree模型进行了外部验证,通过监督式机器学习模型预测UKB患者在BIDMC树上的坐标和表型组归属,以评估模型的普适性。

构建AF表型树并识别五个主要表型组

研究首先利用VAE从海量ECG中提取的51个潜在特征,成功构建了BIDMC AF DDRTree。通过将27个初始子分支合并,最终确定了五个具有代表性的主要表型组(Phenogroups)。这五个表型组在树状结构上呈现出特定的空间分布,彼此间在临床特征、ECG形态和预后风险上存在显著差异。树的核心区域代表了混合或平均的表型,而分支末端则对应着具有极端或独特特征的个体。

各表型组的临床与电生理特征

对这五个表型组的详细描述揭示了其独特性:
  • 表型组1(较高风险AF):患者最年轻,以男性为主,CHA2DS2-VASc评分中位数最低(2),但左心房(Left Atrium, LA)大小相对增加。
  • 表型组2(伴心力衰竭的最高风险AF):LA大小与表型组1相当,但舒张功能不全更为显著,心力衰竭负担重。
  • 表型组3(平均阵发性AF):作为基线比较组,代表了具有平均特征的阵发性AF(Paroxysmal AF, PAF)患者,其指数ECG多为窦性心律(Sinus Rhythm, SR)。
  • 表型组4(较低风险阵发性AF):LA大小和左心室(Left Ventricular, LV)功能更接近正常,风险较低。
  • 表型组5(较高风险阵发性AF):患者年龄最大,ECG显示QRS波时限和QTc间期延长,CHA2DS2-VASc评分中位数最高(4),LA大小异常,并存在传导系统疾病迹象。
各表型组的平均中位数心跳ECG形态可视化显示,表型组1和2的QRS波形态相似,而表型组3和4可见清晰的P波,符合PAF特征。有趣的是,位于树两端的表型组1和5共享相同的top 3潜在特征(因子6、42、20),但关联方向相反,解释了它们在树上的对立位置。例如,因子42与T波形态变异相关,因子20与QRS波形态差异相关。表型组1与这些因子的负关联提示其T波形态正常、QRS波R峰突出;而表型组5则表现为V2-V6导联T波倒置和rS型QRS波伴深S波,可能与束支传导阻滞有关。

表型树捕获AF相关表型的空间分布

研究进一步将AF相关表型(如ECG测量值、临床特征、心律控制治疗)叠加在树状图上,并量化其空间分布模式。结果显示,QRS波时限、心率和窦性心律状态呈现出最强的空间自相关性(p < 0.0001)。QRS波时限、QTc间期和CHA2DS2-VASc评分较高的个体多集中在树的左下区域(低维度2),而PR间期(窦性心律时)和心率较高的个体则多见于右下区域。
在心律控制治疗方面,AF消融(Ablation)的分布在表型空间中较为均匀,但其在树的右上区域(高维度1和高维度2)频率最高。相反,直流电复律(Direct Current Cardioversion, DCCV)则显示出明显的空间聚集性,主要集中在树的右下区域。这表明不同的心律控制策略倾向于应用于特定表型谱系的AF患者。

心血管疾病负担与未来风险的分布趋势

通过多变量回归模型分析,研究发现沿着树状轨迹的不同方向移动,与患病(Prevalent)和发病(Incident)疾病风险存在显著关联。
  • 患病疾病:向维度1(向右)和维度2(向上)移动均与患病疾病 odds 的降低相关。具体而言,位于维度1和维度2较低位置的表型组2和5,与较高的心力衰竭患病风险显著相关(表型组2: aOR 1.13;表型组5: aOR 1.31)。表型组5还与二尖瓣反流(Mitral Regurgitation, MR)负担增加相关(aOR 1.16)。
  • 发病疾病与死亡率:沿着维度2向上移动与所有结局风险(心血管死亡、全因死亡、心力衰竭、卒中、主要不良心血管事件[MACE])的显著降低相关。与之对应,位于维度2较高位置的表型组4表现出最低的未来风险。相反,沿着维度1向右移动,虽然与全因死亡风险降低3%相关(aHR 0.97),但却伴随着心力衰竭(aHR 1.09)、卒中(aHR 1.08)和MACE(aHR 1.10)风险的增加。这使得树的右下象限(高维度1,低维度2,表型组2所在)成为心血管结局最高风险区域,而左下象限(表型组5所在)则与全因死亡风险最高相关。表型组2的未来心力衰竭风险最高(aHR 1.35),表型组5的全因死亡风险增加11%(aHR 1.11)。

心脏结构与功能的变化趋势

echocardiography(超声心动图)指标的分析进一步证实了表型树在捕捉心脏重构方面的能力。沿着维度2向上移动,与左心室射血分数(LV Ejection Fraction, LVEF)增加、左心室舒张末期内径(LV End-Diastolic Diameter, LVEDD)、LA直径、LA指数化容积(LA Volume Indexed, LAVi)和舒张功能不全的改善显著相关。而沿着维度1向右移动,则与LVEDD、LA直径和LAVi的增加相关。
因此,位于左上象限的表型组4与LVEF增加2.78%相关,提示较好的心脏功能。相反,位于右下象限的表型组2则与LVEF降低2.98%、LVEDD增加1.40 mm以及舒张功能不全加重0.27单位相关,反映了更严重的心脏结构和功能损害。

表型组与真实世界AF管理的关联

分析还发现,不同风险表型的AF患者在真实世界中接受的治疗策略也存在差异。低风险的表型组4接受AF消融的几率显著高于基线表型组3(aOR 1.68)。虽然高风险的表型组1也与AF消融几率增加相关(aOR 1.21),但该组患者接受DCCV的几率更高(aOR 1.70),表型组2也呈现类似模式。而表型组5患者接受DCCV的几率则显著降低(aOR 0.73)。这提示临床医生可能已在一定程度上根据患者表型选择治疗策略。

敏感性分析与外部验证

敏感性分析表明,即使在诊断初期(60天内)的ECG或调整了包括LVEF%、LA大小和心律状态在内的临床及超声指标后,主要表型组(2, 4, 5)与结局的关联仍然存在,且方向一致,证明了这些表型组能提供超越传统分类的附加预后信息。
针对记录时心律(AF vs. SR)对表型分组影响的分析显示,心律状态本身与表型组分配无强相关性。当心律由AF转为SR时,表型组分配(尤其是PAF表型组4和5)表现出较高的稳定性;而当心律由SR转为AF时,表型组分配则更不稳定,常重新归类到混合AF表型组(1和2)。这可能反映了疾病进展过程中真实的表型演变。
最后,研究利用UKB队列进行了外部验证。将UKB AF患者投射到BIDMC衍生的树上后,其表型组分布、描述性特征以及心脏磁共振成像(Cardiac MRI, CMR)显示的心脏结构与功能趋势,均与BIDMC队列的结果高度一致,证明了该AI-ECG表型分析框架具有良好的泛化能力。
本研究成功构建并验证了一个基于AI-ECG树状轨迹的AF表型分析系统,揭示了AF患者中存在五个具有显著差异的临床-电生理表型组。这些表型组不仅超越了传统的时长分类,更重要的是,它们与患者特异的心脏结构改变、合并症负担、未来疾病风险以及真实世界的治疗选择紧密关联。该研究方法的优势在于其完全基于ECG形态学特征进行无监督学习,避免了临床先验知识的引入,从而可能发现人眼难以识别的细微差异。所采用的DDRTree方法能够直观展示表型的连续演变,更好地反映了AF的异质性和进展性。
这一研究成果对AF的临床实践具有重要意义。它为AF的精准分型提供了新的维度,有助于识别出那些尽管在传统分类上相似(如同为阵发性AF),但实际风险迥异的患者亚群(如表型组4 vs. 5),从而实现更个体化的风险预测和管理策略制定。例如,低风险表型组4可能更适合接受积极的节律控制策略(如消融),而最高风险的表型组2则可能需要更综合的心衰和猝死风险管理。未来,通过整合多模态数据(如心房结构重构、基因组学等),这一框架有望进一步深化对AF个体化治疗的理解,推动心血管疾病精准医疗的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号