通过整合代谢 - 转录网络推断代谢酶活性并解析肿瘤代谢

【字体: 时间:2025年03月10日 来源:Cell Reports 7.5

编辑推荐:

  本文介绍 iMetAct 框架,可推断代谢酶活性,用于肝癌(HCC)分型及揭示肿瘤免疫代谢关系。

  

引言

细胞代谢是一个高度有序且复杂的调控系统,它对细胞的生存、增殖和维持正常功能至关重要。在肿瘤的发生发展过程中,代谢重编程起着关键作用,其中代谢酶的异常调控更是核心环节。代谢酶不仅参与众多生化反应,其活性变化还与肿瘤的恶性表型密切相关,如肿瘤细胞的快速增殖、侵袭和转移等。
传统的基于光谱的代谢组学方法虽然能直接检测细胞代谢,但存在诸多局限性。例如,它难以全面覆盖所有代谢物,因为细胞内代谢物的化学结构多样,且存在大量同分异构体,这使得准确检测和区分它们变得困难。同时,代谢物浓度在细胞内会受到环境因素的影响,出现短期和频率波动,这进一步增加了对代谢组学数据准确解读的难度,也限制了在体内单细胞分辨率下研究代谢程序的动态变化和异质性。
在维持长期代谢稳态方面,转录调控和非转录机制共同发挥作用。转录调控控制代谢酶的合成,而非转录机制则通过变构调节、翻译后修饰(PTMs)、底物结合和细胞区室化等多种方式调节酶的活性。系统生物学方法利用多组学数据在研究癌症代谢调控方面取得了一定进展,但目前许多研究主要聚焦于代谢酶的表达,对非转录机制在驱动代谢差异中的关键作用探索不足。
基于此,研究人员开发了 iMetAct 这一创新的分析框架。它旨在通过整合代谢 - 转录网络和信息传播策略,从基因表达数据中更准确地推断代谢酶活性,为深入研究肿瘤代谢提供有力工具。

研究方法

iMetAct 模型构建主要包含三个关键步骤。首先是构建传播网络,研究人员整合了来自 KEGG、Reactome、Human - GEM 和 BRENDA 等多个数据库中代谢物与蛋白质 / 酶的相互作用(MPIs)、转录调控关系(TRRs)以及蛋白质 - 蛋白质相互作用(PPIs)信息。这些相互作用经过处理和整合后,构建成一个复杂的网络,并通过 Cytoscape 软件进行可视化展示。在这个网络中,不同类型的相互作用被赋予特定的方向,例如 MPIs 的边从代谢物指向编码催化酶的基因,TRRs 的边从转录因子指向其靶基因,PPIs 的边则标记为双向。随后,利用随机游走重启(RWR)算法模拟细胞代谢对基因调控的影响。该算法将代谢物作为初始点,通过计算亲和力分数()来评估代谢物对网络中基因的潜在调控作用。公式中,为初始转移概率,是归一化邻接矩阵,为重启概率,其取值在 0 - 1 之间,通过枚举法确定最佳值为 0.7。在这个过程中,根据亲和力分数筛选出排名前 80% 的基因,这些基因被认为与细胞代谢调控密切相关,予以保留。
接下来进行互信息计算和网络剪枝。运用 ARACNe - AP 算法计算每个代谢基因与其相连基因之间的互信息(MI),并通过 100 次 bootstrap 分析评估 MI 的统计显著性。设定值大于为非显著,同时将数据处理不等式(DPI)容忍度设为零,以此去除间接相互作用,从而构建出癌症特异性网络。
最后计算代谢酶 / 通路活性分数。借助 VIPER 软件包,通过分析代谢酶相关基因的表达水平来估算其催化活性。具体操作是先利用 “aracne2regulon” 函数整理相关对象,再通过 “aREA” 函数进行分析排名富集分析,最后使用 Viper 函数计算富集分数,并考虑多效性参数。最终得到的归一化富集分数作为代谢酶相对活性水平的指标。对于代谢通路活性分数的计算,则是运用基因集变异分析(GSVA)整合通路中基因的酶活性。从 KEGG 和 Reactome 下载的 gmt 格式文件中提取各通路的基因,GSVA 富集分数代表了通路水平的代谢活性。

研究结果

研究人员将 iMetAct 应用于四个包含平行代谢物谱和基因表达数据的公共数据集,涵盖乳腺癌、卵巢癌、胰腺腺癌和前列腺腺癌。通过评估 iMetAct 分数与代谢酶催化的底物和产物丰度之间的相关性,并与基因表达水平进行对比,发现 iMetAct 分数在预测代谢反应活性方面表现更优。在不同代谢类别中,如氨基酸、碳水化合物、能量、脂质、辅因子、维生素、核苷酸代谢以及其他次生代谢物的生物合成、聚糖生物合成和异生物质的生物降解与代谢等,iMetAct 分数与代谢物的相关性均显著强于基因表达。
为了探究 iMetAct 预测能力与调节子大小的关系,研究人员对酶按调节子大小进行分类,并比较了不同类别中相关系数的分布。结果显示,调节子大小在 200 - 250 范围内的酶,其总体相关系数最高,且随着调节子大小进一步扩大,相关系数并未增加,这表明 iMetAct 分数的预测信息并非单纯由酶在网络中的连接大小决定。
此外,研究人员还将 iMetAct 与单细胞通量估计分析(scFEA)进行比较。结果表明,iMetAct 分数比 scFEA 预测值更能准确捕捉酶 - 代谢物关系。将 iMetAct 分数替代基因表达数据用于 scFEA 时,能显著改善代谢物流预测,凸显了 iMetAct 在通量平衡分析(FBA)中的重要价值。
研究人员还深入研究了磷酸化这一重要代谢调节机制与 iMetAct 预测的酶活性之间的关系。分析包含基因表达和磷酸化谱的数据集后发现,在代谢分数与基因表达相关性较弱(span data-custom-copy-text="\(r 0.2\)")的酶中,有一半(10/20)的酶其磷酸化水平与 iMetAct 分数呈现出显著强相关。例如,CYP1A2、SMPD3、PEBP2 和 PLA2G4C 等酶的蛋白质磷酸化状态对其催化活性的影响已被证实,这进一步支持了研究结果。多数磷酸化位点与通过线性回归分析去除基因表达影响后的剩余 iMetAct 分数存在显著相关性。以 GAPDH 在 S210 位点的磷酸化为例,该修饰会影响其底物结合和催化,且与 iMetAct 分数呈负相关,且这种相关性独立于表达水平。同样,乳酸脱氢酶 A(LDHA)在 Y10 位点的磷酸化,已知可促进糖酵解,也与 iMetAct 分数显著相关。这些数据充分表明,iMetAct 能够有效捕捉包括转录后修饰等多种因素对代谢酶活性的影响。

iMetAct 识别肝癌中未被表征的代谢亚型

研究人员将 iMetAct 应用于癌症基因组图谱(TCGA)队列中 371 例肝癌(HCC)样本的 RNA 测序数据,并利用非负矩阵分解(NMF)对 HCC 代谢亚型进行分类。通过重复 NMF 运行并检查共表达相关指标,最终确定了三个亚型(MS - I、MS - II 和 MS - III),分别包含 73、234 和 64 例患者。
生存分析结果显示,MS - I 患者的生存结局最差,中位生存期仅为 30 个月,而 MS - II 和 MS - III 患者的生存期分别约为 81.9 个月和 41 个月。相比之下,基于酶表达的聚类方法无法有效区分患者的生存情况。这表明 iMetAct 聚类在预测患者生存方面明显优于传统的基于基因表达的方法,且该结果在独立的 HCC 数据集中得到了成功验证,充分证明了研究结果的稳健性和普遍性。
进一步对各 HCC 聚类进行临床和遗传特征分析发现,MS - I 患者具有最高的血清甲胎蛋白(AFP)水平、TP53 突变率和最低的 CTNNB1 突变率,同时肿瘤分期和分级也更高。此外,三个亚型在非整倍体方面存在显著差异。相关性分析表明,参与脂肪酸代谢和过氧化物酶体脂质代谢等途径的酶的代谢分数与肿瘤纯度、DNA 倍性和肿瘤突变负荷(TMB)等关键肿瘤特征具有较高的正相关系数。多变量 Cox 比例风险回归模型进一步证实,iMetAct 亚型是患者生存结局的独立预后因素。
研究人员还将 iMetAct 聚类结果与多种分子特征或方法所识别的聚类进行比较,包括基因表达谱(mRNA 聚类、iCluster)、美国国家癌症研究所增殖特征、复发相关基因表达特征、65 - 基因复发风险评分、肝母细胞瘤 16 基因特征、Hippo 通路特征、胆管癌样特征、Hoshida 特征以及代谢网络驱动方法(iHCC)等。结果显示,MS - I 患者在所有聚类策略中都具有独特性,与其他患者的重叠程度最小,这反映了该群体特殊的分子和代谢特征。而 MS - II 和 MS - III 与已建立的聚类存在显著差异,尤其是与 iCluster、Hoshida 和 iHCC 所识别的聚类。值得注意的是,iHCC 识别出的两个具有相似代谢和分子特征的聚类,而本研究中的 MS - III 表现出更类似于 MS - I 和 MS - II 之间的中间亚型特征。

iMetAct 分数分层揭示亚型特异性特征

对 iMetAct 分数进行差异分析,以探究 HCC 聚类的代谢偏好。结果显示,与 MS - II 和 MS - III 相比,MS - I 在 256 个代谢基因中表现出显著更高的活性(差异 > 1;调整后span data-custom-copy-text="\(p 0.01\)"),在 271 个基因中活性显著更低(差异 <-1;调整后span data-custom-copy-text="\(p 0.01\)")。这一代谢特征具有重要的预后意义,119 个上调基因中有 118 个与不良预后相关(风险比 [HR]>1),207 个下调基因中有 206 个与良好预后相关(HR<1)。此外,21 个与良好生存相关的基因还是可成药靶点,这意味着针对这些代谢酶进行治疗可能会使具有 MS - I 特征的患者受益。
MS - II 呈现出不同的代谢景观,其大多数上调的代谢基因(259/310)与显著良好的生存结局相关。值得注意的是,有 22 个与良好生存相关的基因是通过 iMetAct 分数独特识别出来的,而非基因表达数据。MS - III 在代谢谱上与 MS - I 和 MS - II 略有不同,其有 34 个上调基因和 133 个下调基因,所有 6 个与生存显著相关的上调基因都与不良预后相关。通过分析癌症依赖图谱中的基因必需性数据,进一步证实了代谢活性分数与预后结局之间的联系。CRISPR 数据显示,与不良生存结局相关的代谢酶对肝癌细胞的生存至关重要,其基因效应分数明显更低(更负)。
研究人员推测,HCC 各亚型内的样本趋向于一种与相似生存结局相关的一致代谢活性模式,而这些亚型之间的代谢差异可能由不同的关键驱动信号级联调控。通过主调节因子分析,研究人员识别出在转录、转录后、翻译或翻译后水平调节代谢活动的关键调节因子。结果显示,转录调节因子(TFs)和信号调节因子在调节不同代谢亚型的代谢途径中都发挥着关键作用。例如,MS - I 中的、MS - II 中的和 MS - III 中的分别在调节葡萄糖稳态、脂质代谢和氧化应激方面具有重要作用。此外,还发现了一些通过非转录机制控制代谢的调节因子,如 MS - II 中的激酶,其激活可促进脂质储存;MS - III 中的,作为 RNA 结合蛋白和 mRNA 衰变因子;以及,可催化 ROS 的还原并保护细胞免受线粒体氧化损伤。同时,分析还预测了磷酸激酶在调节代谢中的作用,如 MS - II 亚型中编码 MAP 激酶的参与脂质代谢调节。
研究人员聚焦于四个在肿瘤中高表达且在多个调节水平上其蛋白质活性与糖酵解活性密切相关的代谢调节因子,即 SMARCA4(染色质重塑剂)、CYTH2(酶调节剂)、PPP1R14B(磷酸酶调节剂)和 DYNLL1(酶调节剂)。在 HepG2 细胞中进行小干扰 RNA 介导的基因敲低实验,结果显示,敲低 SMARCA4 会降低葡萄糖摄取,但不影响乳酸产生;CYTH2 敲低导致葡萄糖消耗略有减少,乳酸产生显著降低;PPP1R14B 和 DYNLL1 敲低则使葡萄糖消耗和乳酸产生均显著减少,这表明它们的下调可能促使细胞向较少依赖糖酵解的代谢表型转变。此外,敲低 SMARCA4、CYTH2 和 DYNLL1 显著抑制细胞生长,突出了它们在维持 MS - I 中糖酵解活性和肿瘤细胞增殖的关键作用。
研究人员还对三个 HCC 亚型的代谢途径活性分数进行分析,确定了 80 个在三个亚型中活性水平存在显著差异且每个途径至少包含五个基因的代谢途径。MS - I 上调了 20 条途径,包括糖酵解和肌醇磷酸代谢;MS - II 激活了 49 条与氨基酸、柠檬酸循环(TCA)和脂肪酸 β - 氧化代谢相关的途径;MS - III 则上调了氧化磷酸化(OXPHOS)和戊糖磷酸途径(PPP)。对中央碳代谢的比较分析突出了不同亚型中的差异酶,同时还观察到各亚型中代谢物转运蛋白的表达趋势与代谢需求相适应。例如,MS - I 中负责葡萄糖摄取的基因(如)和负责乳酸输出的转运蛋白()表达升高,而负责乳酸摄取的表达较低,这表明 MS - I 具有增强的葡萄糖摄取和乳酸外排能力。
通过对 MS - I、MS - II 和 MS - III 之间全基因组基因表达差异的研究,探讨了每个 HCC 亚型相关的生物学过程和信号通路。结果显示,MS - I 主要富集在与细胞外基质组织、细胞粘附、趋化作用和 PI3K/AKT 信号通路相关的基因本体(GO)中;MS - II 上调了与 TCA 和脂肪酸代谢以及脂质代谢相关的生物学过程;MS - III 则在 OXPHOS 和 RNA 翻译过程中表现出更高的富集度。与其他亚型相比,MS - I 具有更具侵袭性的特征,预后较差且糖酵解途径更为活跃;而 MS - II 中参与氨基酸代谢、TCA 和脂肪酸 β - 氧化的 HCC 聚类具有更好的生存优势和临床结局。虽然 iMetAct 和 iHCC 聚类在某些相关的 GO / 京都基因与基因组百科全书(KEGG)术语上都有富集,但 iMetAct 所识别的途径和功能在统计上更具显著性。

iMetAct 分数的 HCC 亚型分类模型准确性高且具临床前景

为了测试 iMetAct 在 TCGA 队列之外对 HCC 代谢类型分层的适用性,研究人员开发了一种以 iMetAct 分数聚类为参考的随机森林分类器。通过 5 折交叉验证,使用 70% 的样本进行训练,30% 的样本进行测试,结果显示该分类器具有较高的判别能力(通过曲线下面积衡量)和预测准确性,能够将患者准确分类到三个聚类中。由于 MS - III 的中间特征,偶尔会导致其被误分类为 MS - I 或 MS - II。
研究人员将模型性能评估扩展到两个独立的 HCC 队列。在第一个队列的 54 例患者中,iMetAct 将其分为 MS - I(12 例)和 MS - II(42 例),且有匹配的代谢物谱数据支持。与 TCGA 队列中 MS - I HCCs 高糖酵解活性和核酸代谢的结果一致,该独立验证队列中的 MS - I 聚类显示出更高的总体葡萄糖消耗和核酸含量,而 MS - II 聚类则具有更高的初级胆汁酸生物合成相关代谢物丰度。在第二个队列的 159 例患者中,iMetAct 将 37 例患者分类为 MS - I,84 例为 MS - II,38 例为 MS - III。这种分层在三个聚类中显示出明显不同的预后结局,优于基于 mRNA 和蛋白质谱的分类方法。

iMetAct 的网络平台研究癌症代谢重编程

研究人员评估了 iMetAct 在识别多种 TCGA 癌症代谢亚型中的适用性。利用 33 种癌症类型的 iMetAct 分数,将每种癌症类型的受试者分层为不同数量的亚型(),通过最大化 HCC 患者亚群中生存结局的差异来确定每种癌症类型的最佳聚类数。结果显示,iMetAct 能够有效地将患者分层为具有生物学意义的亚群,在 33 种癌症类型中有 21 种表现出优于基因表达数据的预测能力。
为了方便用户探索不同癌症的代谢特征和临床相关性,研究人员开发了一个交互式网络应用程序,可在http://imetact.com/访问。该网络资源允许用户计算来自 TCGA 或用户上传数据的 iMetAct 分数,对代谢亚型进行分层,识别亚型特异性活动,并分析临床或免疫相关性。

iMetAct 揭示癌症代谢重编程与免疫抑制微环境的联系

癌症代谢重编程不仅为肿瘤生长提供能量,还会影响周围细胞的行为和功能。研究人员对 HCC 亚型的免疫表型及其与癌细胞代谢的联系进行了研究。利用 CIBERSORT 估计 HCC 亚型中 22 种免疫细胞类型的丰度,结果显示 T 细胞和巨噬细胞在各聚类中占主导地位且存在差异。MS - I 患者表现出更高的 T 细胞耗竭和促肿瘤的 M2 巨噬细胞极化,其 TIDE 评分也表明
研究人员进一步将 iMetAct 应用于四个独立的单细胞 RNA 测序数据集,这些数据集包含来自 38 例 HCC 患者的 153,317 个细胞。根据癌细胞的 iMetAct 分数,9 例患者被归为 MS - I,22 例为 MS - II,7 例为 MS - III。MS - I 癌细胞主要依赖糖酵解,MS - II 则更倾向于脂肪酸代谢,MS - III 表现出中间代谢表型,糖酵解和脂肪酸代谢平衡,但 OXPHOS 途径评分升高。临床信息显示,MS - I 患者的生存结局比 MS - II 和 MS - III 患者更差,这进一步验证了 iMetAct 在单细胞水平预测癌细胞代谢偏好的能力。
单细胞免疫表型与批量 RNA 测序结果一致,MS - I 表现出更高的 CD8? T 细胞耗竭和 M2 样极化。相关性分析表明,癌细胞的糖酵解活性评分与 CD8? T 细胞中耗竭标记物的表达水平以及肿瘤相关巨噬细胞(TAMs)中促肿瘤极化标记物的表达水平呈正相关。研究人员推测肿瘤细胞的代谢偏好会影响其与浸润免疫细胞的相互作用,细胞 - 细胞通讯分析显示,MS - I 癌细胞与 CD8? T 细胞之间的共抑制相互作用更强,包括 CD80 - CTLA4、TNF - ICO、CD86 - CTLA4、CD274 - PDCD1 和 LGALS9 - HAVCR2 等。同样,诱导 M2 极化的相互作用在 MS - I 患者中也显著强于 MS - II 或 MS - III 患者,且这些相互作用对中大多数配体的表达与癌细胞内的糖酵解活性呈正相关,表明癌细胞代谢可能影响其与周围免疫细胞的相互作用。

讨论

iMetAct 作为一种创新的分析框架,在将测序数据转化为代谢活性分数方面具有显著优势,相比直接使用代谢基因表达或 FBA 模型,它具有三个关键优势。首先,通过网络拓扑结构评估每个基因对代谢信号传播的贡献,优先考虑与代谢酶核心功能紧密相关的基因,排除代谢功能相关性有限的基因。其次,通过连接代谢物和相应酶,iMetAct 能够整合相邻反应的活性信息,提高酶活性推断的准确性。最后,iMetAct 基于组织特异性数据的互信息计算,决定是否保留或过滤与特定酶拓扑相关但受条件影响的基因,并使用 VIPER 算法评估每个代谢调节子的整体表达模式,从而考虑到转录水平以外影响代谢酶活性的多种调节机制,如翻译调控、翻译后修饰、变构调节或酶降解等。研究通过分析磷酸化对某些代谢基因预测活性的影响,证实了 iMetAct 在捕捉多种调节因素方面的能力,但未来还需要进一步探索蛋白质磷酸化以外的调节因素,以更全面地理解代谢酶活性。
在肝癌研究中,iMetAct 成功识别出三个具有不同代谢、分子和临床特征的亚型。MS - I 表现出增强的 Warburg 效应和 PI3K - AKT 途径激活,与先前研究结果一致;MS - II 在脂质相关代谢过程中表现出较强的活性;MS - III 的代谢谱介于 MS - I 和 MS - II 之间,但具有高 OXPHOS 和 PPP 途径评分等特殊特征。与先前的代谢网络驱动方法相比,iMetAct 的结果存在差异,这解释了为什么在 iHCC 分类中部分 MS - II 样本分布在 iHCC3 中,而不是与 iHCC2 重叠。通过整合主调节因子分析,iMetAct 能够识别出每个亚型中代谢酶和调节因子的独特失调,其中一些在转录后和翻译后水平发挥关键作用。
准确界定肿瘤细胞的代谢活性有助于揭示肿瘤代谢适应与免疫微环境之间的内在联系。单细胞数据分析表明,癌细胞对葡萄糖的高度依赖与免疫监视受损有关,表现为效应 T 细胞激活受抑制、T 细胞耗竭增加以及 TAMs 向 M2 状态极化。未来,进一步完善 iMetAct 在单细胞数据分析中的应用至关重要,包括构建细胞类型特异性网络,以更准确地模拟基因间的信息传播和特定细胞群体内的信号传递强度。
iMetAct 在不同组织样本队列和生理条件下具有广泛的适用性,在 32 种其他 TCGA 癌症类型中都成功实施。基于 iMetAct 构建的交互式在线平台,方便用户浏览、可视化和探索所有 TCGA 肿瘤类型的代谢评分谱的临床关联,为未来利用相关基因表达数据进行疾病代谢的计算研究开辟了新途径,有望加深对疾病发病机制的理解,为治疗策略的开发提供重要参考。

研究局限性

iMetAct 也存在一定的局限性。其依赖的先验相互作用组数据并不完整,且具有组织和条件依赖性,这给网络内信息传播的精确和全面建模带来了挑战。虽然 iMetAct 优先考虑经典代谢功能,但无法完全消除非经典酶作用的影响,可能会纳入一些功能无关的基因。未来,纳入关于非经典功能的先验知识可能会提高基因筛选的准确性,优化模型。此外,iMetAct 目前将代谢活性分数的变化归因于调节因子的集体影响,无法区分各个调节因子的具体贡献。

资源可用性

如需进一步的信息、资源和试剂,可联系主要联系人郑涛?肖(Zhengtao Xiao),邮箱为 zhengtao.xiao@xjtu.edu.cn。本研究未生成新的独特试剂,分析的是公开可用的数据集,相关 accession numbers 在关键资源表中提供。iMetAct 软件包已存于 Zenodo(https://doi.org/10.5281/zenodo.14725756)和 GitHub(https://github.com/xiaolab-xjtu/iMetAct),如需重新分析本文数据的其他信息,可向主要联系人索取。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号