基于程序性细胞死亡(PCD)基因表达及机器学习解析弥漫大 B 细胞淋巴瘤(DLBCL)的预测生物标志物与分子亚型

【字体: 时间:2025年04月18日 来源:Discover Oncology 2.8

编辑推荐:

  为解决弥漫大 B 细胞淋巴瘤(DLBCL)患者预后差异大、缺乏有效预测生物标志物的问题,研究人员开展了基于 PCD 基因表达和机器学习的研究。结果发现 DLBCL 两种亚型,C2 亚型为高风险,还确定了 5 个潜在生物标志物,这为 DLBCL 风险分层和治疗提供了新方向。

  弥漫大 B 细胞淋巴瘤(Diffuse large B-cell lymphoma,DLBCL)是最常见的非霍奇金淋巴瘤亚型,全球发病率呈上升趋势。尽管现有治疗方案不断改进,但因其高度的临床和分子异质性,约 30 - 40% 的患者在初始治疗后 2 - 5 年内仍会复发或产生耐药,预后较差。因此,寻找特异性生物标志物对 DLBCL 的筛查、诊断和预后预测至关重要。
在这样的背景下,山西医科大学、中国人民解放军总医院等机构的研究人员开展了一项研究,旨在基于程序性细胞死亡(Programmed cell death,PCD)相关特征,利用机器学习方法构建 DLBCL 诊断模型,探究 PCD 相关基因在 DLBCL 发生发展中的潜在作用。该研究成果发表在《Discover Oncology》上。

研究人员为开展此项研究,主要运用了以下关键技术方法:从公共数据库获取 5 个 DLBCL 数据集,纳入 PCD 相关基因进行后续分析;通过共识聚类分析对患者分层;利用 CIBERSORT 软件进行免疫浸润分析,用基因集变异分析(GSVA)富集分析通路差异;借助加权基因共表达网络分析(WGCNA)筛选关键基因模块;整合 12 种机器学习算法构建预测模型;对 DLBCL 细胞系 VAL 和正常人类 B 淋巴细胞细胞系 IM - 9 进行转录组测序验证潜在生物标志物。

研究结果如下:

  1. 差异表达分析:从 1545 个 PCD 相关基因中鉴定出 1074 个差异表达基因(Differentially expressed genes,DEGs),涉及多种 PCD 形式相关基因,如凋亡、焦亡、铁死亡等。
  2. 共识聚类分析:基于 1074 个 DEGs 进行聚类分析,确定最佳聚类数为 k = 2,将 DLBCL 患者分为 C1 和 C2 两个亚组。C1 亚组有 306 个基因显著上调,C2 亚组有 148 个基因显著上调,主成分分析(Principal Component Analysis,PCA)验证了分组的有效性。
  3. PCD 相关免疫浸润和 GSVA 富集分析:C1 和 C2 亚组在多种免疫细胞比例上存在显著差异。GSVA 富集分析显示,C2 亚组 DNA 修复、细胞周期和能量代谢通路上调,免疫反应和溶酶体功能相关通路下调,提示其增殖能力和代谢活性较高,可能存在免疫逃逸机制1
  4. WGCNA 分析:对 DLBCL 与健康对照以及 C1 和 C2 亚组转录组数据进行分析,筛选出两个模块,经交集得到 7 个 DLBCL 特征基因。
  5. 机器学习模型构建与评估:整合 12 种机器学习算法构建 91 种模型,多数模型 F - score 和 AUC 值表现良好,XGBoost 和 GBM 等集成学习方法性能更优。特征重要性分析确定了 CTSB、DPYD 等多个关键基因。
  6. 转录组分析:比较 VAL 和 IM - 9 细胞系基因表达,发现 863 个 PCD 相关基因差异表达,其中 CTSB、DPYD、SCARB2 上调,STOM 和 GBP1 下调。

研究结论和讨论部分指出,该研究基于 PCD 相关基因表达揭示了 DLBCL 的两种亚型,C2 亚型因 DNA 修复和细胞周期通路增强被认定为高风险亚型。同时确定的 5 个关键生物标志物(CTSB、DPYD、SCARB2、STOM、GBP1),有助于优化 DLBCL 风险分层,增进对其分子异质性的理解,为后续研究 DLBCL 的生物学机制和改善预后奠定了基础。未来还需进一步明确这些生物标志物的功能及其在 DLBCL 生物学中的意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号