《Aging Cell》:Association of Epigenetic Age Acceleration and Mitochondrial DNA-Based Aging Metrics Provides Insights Into Mechanisms of Aging-Related Diseases
编辑推荐:
本研究通过整合四项队列研究数据,系统评估了mtDNA异质性负担(包括罕见和常见变异)及mtDNA拷贝数(mtDNA CN)与表观遗传衰老加速(EAA)指标的关系,并探讨其在代谢疾病中的中介作用。发现罕见变异的MSS评分与EAA Horvath、Hannum及PhenoAge显著正相关,而低mtDNA CN与DunedinPACE负相关。中介分析表明,DunedinPACE介导了mtDNA CN与肥胖及2型糖尿病的关联。结果提示mtDNA异质性和拷贝数通过表观遗传时钟影响代谢健康,且关联强度随年龄增长增强。
本研究探讨了线粒体DNA(mtDNA)变异与表观遗传衰老指标之间的相互作用,旨在揭示与年龄相关疾病相关的生物学机制。通过分析6316名参与者(其中58%为女性,41%为非白人美国人)的DNA甲基化数据,我们计算了表观遗传年龄加速(EAA)指标,并从全基因组测序数据中提取了mtDNA相关指标,包括异质性变异和mtDNA拷贝数(mtDNA CN)。研究采用了线性回归和元分析方法,评估了EAA与mtDNA指标之间的关联,同时调整了年龄、自我报告的性别以及其他协变量。此外,我们还进行了中介分析,以探讨mtDNA CN是否通过EAA与代谢性状(如肥胖和2型糖尿病,T2DM)之间存在中介效应。
研究发现,罕见异质性变异的负担与第一代EAA指标的加速存在显著关联,而较低的mtDNA拷贝数则与第二代和第三代EAA指标的加速有关。例如,在所有参与者中,MSS(基于罕见异质性变异预测功能的得分)每增加一个标准差(SD),与Hannum方法的EAA加速0.22年(
p?=?1.3E-6)相关;而在mtDNA拷贝数每减少一个SD时,与DunedinPACE指标的加速(
β?=??0.005,
p?=?6.0E-4)有关。值得注意的是,常见变异的异质性负担与EAA之间未发现显著关联。此外,我们还发现,在老年FHS参与者中,DunedinPACE介导了mtDNA拷贝数与肥胖和T2DM之间关联的11.1%和10.8%。这些结果表明,较高的罕见异质性变异负担和较低的mtDNA拷贝数均与加速表观遗传衰老有关,且这些关联在老年人中表现得更为明显。
线粒体DNA是细胞中重要的遗传物质,它不仅参与能量代谢,还在细胞活动调控中发挥关键作用。人类线粒体基因组包含约16,569个碱基对,编码了37个基因。在每个细胞中,存在数百到数千个mtDNA分子,这使得我们能够从两个角度评估mtDNA状态:拷贝数和异质性负担。以往的研究表明,较低的mtDNA拷贝数与年龄增长、全因死亡率、整体健康状况、认知功能以及心血管疾病(CVD)等有关。而异质性是指在同一个个体的线粒体DNA位点上,两种或更多核苷酸同时存在的现象。较高的异质性负担可能与年龄增长和年龄相关疾病的发生有关。作为衰老的两个主要标志,表观遗传调控和mtDNA指标的变化反映了动态的生物学过程。尽管已有研究探讨了mtDNA同质性和异质性变异对核表观遗传组的潜在调控作用,但这两个衰老标志之间的关系尚未完全阐明。因此,理解它们之间的相互作用对于揭示年龄相关疾病的生物学机制具有重要意义。
我们假设,mtDNA拷贝数和基于罕见及常见变异的异质性负担得分能够反映线粒体生物学的不同方面,并与生物衰老和代谢性状表现出不同的关联。罕见变异可能代表近期的、可能具有致病性的突变事件,而常见变异则可能代表稳定的、遗传的变异。相比之下,mtDNA拷贝数是线粒体丰度和功能能力的更广泛指标。为了验证这一假设,我们对四个纵向队列研究中的6316名参与者进行了分析,比较了基于罕见和常见异质性变异的异质性负担得分与多个EAA指标之间的关系。我们还评估了mtDNA拷贝数、表观遗传衰老指标以及代谢性状(如肥胖和T2DM)之间的关系,采用中介分析和孟德尔随机化分析方法。探讨这两个分子衰老指标之间的关系,有助于揭示它们在年龄相关疾病中的作用,并可能为延缓衰老或减轻其影响的治疗策略提供依据。
本研究涵盖了四个纵向队列:FHS(佛拉明戈心脏研究,
n?=?1745)、JHS(杰克逊心脏研究,
n?=?1424)、MESA(多民族动脉粥样硬化研究,
n?=?858)以及CARDIA(冠状动脉风险发展研究,
n?=?2289)。其中,FHS、JHS和MESA主要由中老年人组成(平均年龄:55–61岁),而CARDIA则由年轻人(平均年龄:46岁)组成。在所有统计分析中,均使用了自我报告的种族/民族和自我认同的性别(即男性和女性)。FHS主要由自我报告的白人参与者组成,而JHS则包括自我报告的黑人参与者。CARDIA涵盖了两个种族群体,MESA则包括了白人、黑人和西班牙裔美国人。由于白人和西班牙裔美国人在遗传效应上具有相似性,我们在MESA中将西班牙裔美国人与白人参与者合并进行统计分析(使用一个种族变量)。
DNA甲基化是DNA调控的一种方式,涉及在胞嘧啶的第5位碳原子上添加甲基基团。甲基化状态的变化与衰老和年龄相关疾病有关,为估计生物年龄提供了理论基础。表观遗传年龄加速(EAA)定义为基于DNA甲基化数据计算的生物年龄与实际年龄之间的差异。较高的EAA表明个体的生物衰老速度超过了其实际年龄。大量研究表明,较高的EAA是寿命缩短的强预测因子,并与死亡率升高、虚弱增加以及多种年龄相关疾病(如心血管疾病、神经退行性疾病和癌症)相关。通过DNA甲基化数据计算的EAA指标,如EAAHorvath、EAAHannum、EAAPheno和EAAGrim,已被广泛用于研究衰老的生物学过程。而第三代表观遗传时钟——DunedinPACE,则通过估计每年的衰老速度,而不是年龄本身,提供了另一种视角。
本研究中,我们利用全基因组测序(WGS)数据计算了mtDNA拷贝数和异质性变异。WGS数据在TOPMed(精准医学跨组学研究)计划的参与者中具有平均39倍的核DNA覆盖。TOPMed信息研究中心对所有BAM文件进行了标准化处理,将其比对至人类基因组构建版本GRCh38。在这项研究中,四个研究队列的WGS均在三个TOPMed测序中心进行,随后使用Freeze 10数据进行联合变异识别。
为了识别mtDNA异质性变异,我们采用了mitoHPC(线粒体高通量分析)工具,该工具是一种自动化流程,用于分析线粒体DNA序列读取数据,并考虑了线粒体染色体的环状结构。简而言之,mtDNA测序数据首先被比对至GRCh38的线粒体染色体(chrM),并提取了核整合的线粒体序列(NUMT)区域以构建mtDNA读取池。mtDNA读取数据进一步被比对至一个环状的chrM,以恢复低覆盖区域。mitoHPC进行了两次迭代:第一次以修订的剑桥参考序列(rCRS)为参考基因组识别mtDNA异质性变异;第二次则利用“BCFtools”为每个样本生成一个独特的参考基因组,以降低假阳性率。我们使用了第二次迭代中识别出的mtDNA异质性变异进行后续分析。
我们采用了两种基于罕见变异的指标来衡量每个样本的总异质性水平。MHcount(异质性计数)是第
i个个体在
个位点上的罕见异质性变异总数:$$ {\mathrm{MHcount}}_i=\sum \limits_j{H}_{ij} $$。MSS(线粒体局部约束得分总和)是一个基于罕见异质性变异预测功能的加权得分:$$ {\mathrm{MSS}}_i=\sum \limits_j{m}_{ja}{H}_{ij} $$。其中,mja衡量了在第个异质性位点上,替代等位基因a的线粒体局部约束(MLC)得分。MLC范围从0到1,更高的MLC表明该变异可能更具有致病性。因此,更高的MSS得分可能意味着更严重的生物学后果。
我们还计算了基于常见异质性变异的异质性负担得分(MHcomcount),即39个在至少500名英国生物银行参与者中出现的常见异质性变异的总和:$$ {\mathrm{MH}}_{\mathrm{com}}{\mathrm{count}}_i=\sum \limits_j{C}_{ij} $$。我们测试了常见异质性变异负担是否与表观遗传年龄加速指标存在关联。
mtDNA拷贝数的计算是由TOPMed信息研究中心基于WGS数据联合完成的。mtDNA拷贝数是通过将平均线粒体基因组覆盖与平均核基因组覆盖的比值来计算的,考虑到线粒体DNA的单倍体特性。平均基因组覆盖是通过将映射读数数量除以标准人类基因组大小得到的。
我们通过将每个mtDNA指标与血液细胞计数、批次效应和吸烟状况进行回归,获得了这些指标的残差。为了标准化,我们将每个mtDNA指标的残差进行均值为0、标准差为1的调整。这有助于消除不同批次和实验条件对分析结果的影响。
为了探讨线粒体衰老指标与EAA之间的关系,我们使用了肥胖和T2DM作为中介分析的代谢性状。肥胖定义为体重指数(BMI)≥30?kg/m2,T2DM定义为空腹血糖水平≥126?mg/dL或当前使用糖尿病治疗药物。我们还评估了主要心血管疾病(CVD)风险因素(如BMI、高血压、高血脂、T2DM和现有CVD)是否对mtDNA指标与EAA之间的关联产生混淆作用。2期高血压定义为收缩压≥140?mmHg、舒张压≥90?mmHg或当前使用降压药物。我们关注这一群体,因为其在临床上具有重要意义,且心血管事件风险较高,诊断阈值也较为明确。高血脂定义为空腹总胆固醇≥200?mg/dL、甘油三酯≥150?mg/dL或当前使用降脂药物。现有CVD定义为心血管疾病的诊断,包括已知的心肌梗死、中风和心力衰竭。
在mtDNA指标与EAA指标的关联分析中,我们排除了具有MHcount > 5或mtDNA拷贝数小于40的样本,以减少潜在的测序误差或样本污染。在FHS队列中,我们进行了队列特异性线性回归,以量化每个EAA指标(因变量)与标准化mtDNA指标残差(自变量)之间的关联,调整了实际年龄、实际年龄平方、自我报告的性别、吸烟状况、白细胞组成比例、批次效应以及FHS队列中的实验室指标。由于以往研究表明,老年人的mtDNA拷贝数较低,而异质性负担较高,因此我们按实际年龄(<60岁和≥60岁)和性别进行了分层分析。
在敏感性分析中,进一步调整CVD及其风险因素后,基于罕见变异的异质性负担得分与EAA指标之间的关联得到了加强。例如,在FHS队列中,MSS每增加一个SD,与EAAHorvath(β?=?0.42,p?=?1.6E-5)和EAAHannum(β?=?0.54,p?=?4.0E-10)的关联显著增强。在调整后,MSS与EAAPheno的关联也增强(β?=?0.35,p?=?6.3E-4),而未调整时的关联为(β?=?0.30,p?=?0.005)。将母系结构作为随机效应进行关联测试后,结果与主发现分析高度一致(R2?=?0.995)。在调整母系结构后,MHcount与EAAGrim之间的正向关联变得显著(p?=?0.004),而未调整时的关联方向相同但未达到统计学意义(p?=?0.03)。
在次要分析中,我们评估了自我报告的黑人和白人参与者之间的异质性负担得分与EAA指标的关联。大多数关联在两个群体中表现出一致的方向(补充结果,图S4a,表S5)。此外,我们进一步分析了在FHS参与者中,哪些CpG位点可能对EAA与mtDNA负担得分之间的关联做出贡献。在1950个用于构建EAA指标的CpG位点中,有85个与MSS相关,而有40个与MHcount相关(FDR < 0.05),但没有CpG探针与MHcomcount相关。
我们还进行了基于CVD及其风险因素的敏感性分析,发现调整后,mtDNA拷贝数与EAA指标之间的关联大幅减弱,这表明这些风险因素可能对两者之间的关系产生混淆。这一解释与以往研究一致,即加速表观遗传衰老与CVD密切相关,而CVD的主要风险因素(如肥胖、T2DM、高血压和高血脂)也与加速表观遗传衰老相关。mtDNA拷贝数还与白细胞计数相关,白细胞计数是CVD相关炎症的一个常见指标。此外,炎症与生物衰老高度相关。因此,这些发现表明,mtDNA拷贝数可能主要反映与生物衰老相关的炎症状态,而非衰老本身。相比之下,基于罕见异质性变异的负担得分与EAA指标之间的关联在调整CVD相关因素后增强,表明异质性负担可能更具体地反映生物衰老的特征。这一观点与普遍认为罕见异质性变异来源于随时间积累的体细胞突变相符,因此更直接地反映年龄相关的分子变化。
虽然CVD风险因素可能对mtDNA拷贝数与EAA指标之间的横断面关联产生混淆,但我们的双向中介分析表明,DunedinPACE在老年FHS参与者中介导了mtDNA拷贝数与代谢性状(如肥胖和T2DM)之间的关系。然而,我们的研究无法确定因果通路的方向,因为DunedinPACE的间接效应在正向方向(mtDNA拷贝数为预测变量,代谢性状为结果变量)和反向方向(代谢性状为预测变量,mtDNA拷贝数为结果变量)中表现出相同的方向和相似的强度。这些发现可以解释为双向中介分析中箭头方向的对称性(Thoemmes, 2015),其中在两个方向上可能存在几乎对称的统计分解。因此,当使用横断面数据时,间接效应(暴露-中介效应与中介-结果效应的乘积)在两个方向上表现出相似的强度和显著性。
此外,由于本研究使用的是横断面数据,我们的发现强调了未来在更大规模、更多样化的纵向队列中进行中介效应验证的必要性。我们的双样本孟德尔随机化(MR)分析提供了mtDNA拷贝数对表观遗传衰老可能具有因果效应的潜在证据。结合调整混淆因素的方法、中介分析和因果推断的结果,进一步揭示了mtDNA、衰老和代谢健康之间的复杂关系,并强调了整合多种分析方法研究这些关系的重要性。
本研究也存在一些局限性。首先,我们限制分析范围为异质性变异,其等位基因频率(MAF)在5%–95%之间,以减少测序误差和潜在的NUMT相关混淆(Hong et al., 2023)。这可能导致低水平异质性的排除,并低估其与表观遗传衰老的关联。其次,mitoHPC管道在检测同源序列(即包含重复相同核苷酸的区域)或高变区的异质性时可能存在一定的敏感性限制(Battle et al., 2022)。我们的MR分析使用了与传统(非基于主成分的)EAA指标相关的GWAS单核苷酸多态性(SNP),而我们的主要分析则集中在基于主成分的时钟上。尽管这两种时钟版本在FHS参与者中高度相关(R2:0.93–0.99),但GWAS SNP可能无法完全捕捉基于主成分的时钟的遗传结构。此外,DunedinPACE的GWAS缺失限制了我们对mtDNA拷贝数与DunedinPACE之间因果路径的探索。最后,本研究中的队列在人口学特征上存在差异,包括年龄、性别和种族/民族分布。尽管我们采用了统一的流程来计算EAA指标和mtDNA指标,并调整了潜在的混淆因素,但残留的异质性仍可能引入偏差。然而,从多样化的群体中获得的发现可能有助于将我们的结果推广到更广泛的人群。
综上所述,本研究观察到mtDNA与表观遗传衰老指标之间存在显著关联,并提供了EAA指标介导mtDNA拷贝数与代谢疾病之间关系的证据。这些发现揭示了mtDNA指标、表观遗传通路和代谢性状之间的复杂相互作用,有助于我们更深入地理解衰老的机制,并将核基因组和线粒体基因组与临床结果联系起来。然而,仍需要更大规模、更多样化的纵向研究来明确这些关系的方向性。