整合 RNA - seq 数据揭示儿童 B - ALL 细胞死亡新模式并构建复发预测模型

【字体: 时间:2025年02月16日 来源:Scientific Reports 3.8

编辑推荐:

  为解决儿童 B-ALL 复发预测难题,南方医科大学南方医院研究人员整合 RNA-seq 数据开展相关研究。他们构建了 PCD 相关的复发预测模型,还明确多种 PCD 模式与复发的关系。该成果对疾病研究及个性化治疗意义重大,值得科研读者一读。

  
南方医科大学南方医院儿科的研究人员 Yaxin Luo、Lin Tan、Chuikai Meng 等人在《Scientific Reports》期刊上发表了题为 “Integrating bulk RNA-seq and scRNA-seq data to explore diverse cell death patterns and develop a programmed cell death-related relapse prediction model in pediatric B-ALL” 的论文。这篇论文在儿童急性 B 淋巴细胞白血病(B-ALL)研究领域意义重大,为深入了解疾病机制、预测疾病复发以及制定个性化治疗方案提供了新的思路和方法。

研究背景


急性 B 淋巴细胞白血病(B-ALL)是一种血液系统恶性肿瘤,其特征为不成熟 B 淋巴细胞的不受控制增殖。随着微小残留病监测(MRD)和强化疗的发展,大部分儿童患者能够实现持续完全缓解,儿童急性淋巴细胞白血病的 5 年总生存率预估可达 90%。然而,复发的 B-ALL 仍然是一个严峻的挑战,15%-20% 的患者会出现复发,复发患者的生存率相比初诊时大幅降低。有数据显示,急性淋巴细胞白血病首次复发患者的 5 年总生存率约为 50%,二次或多次复发患者的预后则更差。

白血病复发的演变过程复杂,存在众多异常情况。从初诊开始,许多异常就持续存在,如复发急性淋巴细胞白血病患者常见表观遗传调节因子和染色质修饰剂的基因改变,这可能会影响抗白血病药物的药代动力学、肿瘤微环境与 ALL 细胞之间的相互作用以及肿瘤生物学本身,进而降低治疗效果。此外,PDE4B 基因的风险变异也与复发相关,它会影响甲氨蝶呤的药效和肿瘤对类固醇的敏感性。虽然综合基因组分析对复发生物学有了更深入的了解,但寻找能更准确预测复发的新型生物标志物,以提高儿童 B-ALL 患者的长期预后,仍然至关重要。

程序性细胞死亡(PCD)是肿瘤进展中一个受调控的生物学过程,对肿瘤的发展有着重要影响。近年来发现了多种形式的 PCD,包括细胞凋亡(Apoptosis)、焦亡(Pyroptosis)、铁死亡(Ferroptosis)、自噬(Autophagy)、坏死性凋亡(Necroptosis)、铜死亡(Cuproptosis)等。在 B-ALL 中,PI3K/AKT/mTORC1 和 NOTCH1 信号通路的失调会影响自噬的调节,糖皮质激素可用于诱导自噬和细胞死亡来治疗 B-ALL,但自噬在 ETV6-RUNX1 阳性细胞中也会促进细胞增殖和耐药,使治疗结果更加复杂。在儿童 ALL 中,缓解失败和复发与 Bax/Bcl-2 比值降低有关,该比值是平衡抗凋亡和促凋亡活动的关键因素 。尽管有这些发现,但 PCD 模式与儿童 B-ALL 之间关系的综合研究仍有待开展。

研究方法


  1. 数据收集:研究人员从多个数据库获取数据,包括通过 UCSC Xena 平台、基因表达综合数据库(GEO)和 GTEx 数据库收集儿童 B-ALL 患者和健康对照的 RNA 测序(RNA-seq)数据及临床资料。此外,还收集了中国南方医院提供的 78 例儿童 B-ALL 患者的 RNA 测序数据和全面临床信息。其中,TARGET 队列作为发现队列,南方队列和 GSE7440 作为验证队列。同时,从 GSEA 基因集、KEGG 和已发表文献中整理出 1571 个与 PCD 相关的基因。
  2. 识别与复发相关的 PCD 模式:利用 R 包 “Gene Set Variation Analysis (GSVA)” 中的单样本基因集富集分析(ssGSEA),计算 TARGET 队列中 16 种 PCD 模式的富集分数。随后进行单变量 Cox 回归分析,以确定与复发显著相关的 PCD 模式()。
  3. 单细胞 RNA-seq 数据处理:使用来自 GSE130116 的 7 例初诊儿童 B-ALL 患者的单细胞 RNA 测序(scRNA-seq)数据,借助 R 包 “Seurat” 进行质量控制,筛选标准为 nFeature_RNA>300、percent.mt <30 和 nCount_RNA > 1000 。利用 “FindVariableFeatures” 函数筛选出前 3000 个基因,再通过 R 包 “SingleR” 对细胞进行聚类分类,最后用 R 包 “AUCell” 评估每种 PCD 模式的活性。
  4. 构建 CDI 模型:将 TARGET 队列以 6:4 的比例随机分为训练队列()和测试队列()。先通过单变量 Cox 回归识别与复发相关 PCD 模式的基因(),再利用 R 包 “glmnet” 进行 LASSO 回归分析,筛选出具有非零惩罚系数的基因。对这些基因进行多变量 Cox 回归分析,构建细胞死亡指数(CDI)模型。根据 CDI 模型确定的最佳截断值,将患者分为高 CDI 组和低 CDI 组。
  5. 构建和评估列线图:通过单变量和多变量 Cox 回归分析评估 CDI 模型的独立预测能力,使用 R 包‘rms’和‘regplot’生成并可视化列线图,利用校准图评估模型的准确性。
  6. 肿瘤环境分析:运用 CIBERSORT 算法比较 TARGET 队列中高 CDI 组和低 CDI 组 22 种免疫细胞类型的比例,采用 Pearson 相关分析评估 CDI 评分与免疫细胞类型、免疫检查点及调节剂之间的关系。使用 ESTIMATE 比较高 CDI 组和低 CDI 组的细胞评分、免疫细胞评分和 ESTIMATE 评分。
  7. 功能富集和药物敏感性分析:借助 R 包‘GSVA’评估 CDI 评分与富集信号通路的关系,利用 R 包‘pRRophetic’计算 138 种药物在高 CDI 组和低 CDI 组中的半数最大抑制浓度(IC50)值,评估药物敏感性。
  8. 统计分析:所有统计分析均使用 R 软件(版本 4.1.2)进行,两组比较采用 Wilcoxon 检验,用‘survminer’包确定最佳截断值,通过 Kaplan-Meier 生存分析和对数秩检验评估生存情况,利用受试者工作特征(ROC)曲线评估风险评分的特异性和敏感性,并计算曲线下面积(AUC)。

研究结果


  1. 儿童 B-ALL 患者程序性细胞死亡模式的总体情况:研究人员整合生物信息学分析流程,全面描述 B-ALL 中 PCD 模式的情况。通过单变量 Cox 回归分析,发现 9 种 PCD 模式与 B-ALL 复发显著相关,其中铁死亡、自噬、坏死性凋亡、细胞内卷亡(Entotic cell death)和碱死亡(Alkaliptosis)为保护因素,细胞凋亡、网织细胞死亡(Netotic cell death)、氧死亡(Oxeiptosis)和中性粒细胞胞外陷阱形成(NETosis)为风险因素 。随后的 Kaplan-Meier 分析进一步阐明了这 9 种 PCD 模式在儿童 B-ALL 复发中的作用。
  2. 单细胞测序中 PCD 模式的探索:利用包含 7 例初诊儿童 B-ALL 患者数据的单细胞数据库 GSE130116,经过多次质量控制和筛选,得到由 39926 个单细胞和 21209 个基因组成的表达矩阵。通过 “SingleR” 包将细胞分为 7 种主要细胞类型,运用 AUCell 计算每种细胞中 16 种 PCD 模式的活性分数。结果显示,除氧死亡和网织细胞死亡外,大多数与复发相关的 PCD 模式广泛激活,尤其是细胞凋亡、自噬、铁死亡和坏死性凋亡。
  3. 儿童 B-ALL 患者诊断时 CDI 模型的构建:通过单变量 Cox 回归分析(),从 9 种与复发相关的 PCD 模式中筛选出 356 个复发相关基因。经 LASSO 回归分析,确定了 7 个具有非零惩罚系数的基因:Bcl-2 相互作用蛋白(BIK)、转运蛋白(TSPO)、BCL2L2、磷脂酰肌醇 - 5 - 磷酸 4 - 激酶 2C(PIP4K2C)、混合谱系激酶样蛋白(MLKL)、信号转导和转录激活因子 2(STAT2)和含 WW 结构域的氧化还原酶(WWOX) 。基于这 7 个基因构建多变量 Cox 回归模型,得出细胞死亡指数(CDI)的计算公式。将训练队列和测试队列根据最佳截断值分别分为高 CDI 组和低 CDI 组,Kaplan-Meier 分析表明,高 CDI 组患者的无复发生存期(RFS)比低 CDI 组更差。训练队列中 1 年、3 年和 5 年无复发率的 AUC 值分别为 0.890、0.883 和 0.943,测试队列中分别为 0.896、0.752 和 0.935。在南方队列和 GSE7440 验证队列中也得到了类似结果。
  4. CDI 特征作为儿童 B-ALL 独立预后因素:通过单变量和多变量 Cox 回归分析评估 CDI 对复发的独立预测价值,结果显示 CDI 是显著的风险因素。在高风险组和标准风险组中进行分析发现,CDI 在高风险组中是风险因素,且年龄也与预后相关;在标准风险组中,CDI 和 TCF3::PBX1 融合基因是显著风险因素。此外,构建的列线图对高风险组 1 年、3 年和 5 年无复发生存率的预测准确性良好。
  5. 肿瘤微环境分析:CIBERSORT 分析表明,高 CDI 组浆细胞比例较高,低 CDI 组 M2 型巨噬细胞、嗜酸性粒细胞和中性粒细胞水平较高。所有模型基因与免疫细胞浸润密切相关,CDI 评分与免疫检查点和调节剂显著相关。CDI 评分与单核细胞呈正相关,与 M2 型巨噬细胞呈负相关。ESTIMATE 分析显示,高风险组和低风险组的基质细胞评分存在显著差异。
  6. CDI 特征的功能富集分析:利用‘GSVA’分析发现,CDI 评分与多种 HALLMARK 通路呈正相关,如脂肪生成、DNA 修复、雌激素晚期反应等;与 IL6 JAK STAT3 信号通路、干扰素 α 反应等呈负相关。
  7. 预后特征的治疗价值:计算 B-ALL 样本中每种药物的 IC50 值,发现低风险组对舒尼替尼、异环磷酰胺、伊马替尼、坦度替尼和硼替佐米的敏感性更高。

研究结论与讨论


该研究全面探究了 B-ALL 中 16 种 PCD 模式的活性,并构建了用于复发预测的 CDI 模型,该模型包含 7 个 PCD 相关基因。通过 Kaplan-Meier 分析和 ROC 曲线分析,验证了 CDI 模型在临床管理中的实用性,且单变量和多变量 Cox 回归分析证实其为独立风险因素。此外,研究还探讨了 CDI 模型与肿瘤微环境、免疫调节剂和药物敏感性之间的关系。

研究通过 RNA-seq 和 scRNA-seq 综合分析,确定了 9 种与 B-ALL 复发密切相关的 PCD 模式。对其中部分模式涉及的模型基因进行深入研究发现,如细胞凋亡相关的 BIK、BCL2L2 和 WWOX 基因,自噬相关的 TSPO 和 PIP4K2C 基因,坏死性凋亡相关的 MLKL 和 STAT2 基因等,它们在 B-ALL 的发展、耐药及复发过程中发挥着重要作用。但部分 PCD 模式如细胞内卷亡、碱死亡、网织细胞死亡、氧死亡和 NETosis 在 B-ALL 中的具体作用仍有待进一步研究。

研究还发现,急性 B 淋巴细胞白血病会改变周围微环境,高 CDI 组患者中 M2 型巨噬细胞表达升高,这可能成为新型治疗的潜在靶点。然而,该研究也存在一些局限性。外部验证队列(南方队列)阳性病例数相对较少,可能会引入偏差;列线图仅针对高风险组设计,通用性受限且缺乏外部验证;缺乏免疫治疗相关数据,无法深入探究 CDI 与药物敏感性的关系。未来需要更多综合实验,如蛋白质水平分析和细胞功能检测等,进一步验证 CDI 在儿童 B-ALL 中的作用和机制。

总体而言,这项研究为 B-ALL 患者的研究提供了新的视角,对 PCD 模式的深入了解以及 CDI 模型的构建,有助于开发个性化治疗策略,为提高 B-ALL 患者的治疗效果和预后带来了新的希望。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号