机器学习助力发现弥漫大 B 细胞淋巴瘤铜死亡相关 lncRNA 生物标志物,开启精准诊疗新篇章

【字体: 时间:2025年04月23日 来源:Cell Biology and Toxicology 5.3

编辑推荐:

  弥漫大 B 细胞淋巴瘤(DLBCL)异质性强,治疗棘手。研究人员开展基于机器学习识别 DLBCL 中铜死亡相关 lncRNA 生物标志物的研究。他们构建模型,确定 MALAT1 促细胞增殖。该研究为 DLBCL 诊疗提供新方向。

  在癌症治疗的漫长探索道路上,弥漫大 B 细胞淋巴瘤(Diffuse Large B-Cell Lymphoma,DLBCL)如同一只凶猛的 “拦路虎”,给患者和医疗界带来了巨大挑战。DLBCL 是成人中最为常见的非霍奇金淋巴瘤,占据了所有病例的 30 - 40%。它就像一个善变的 “伪装者”,具有高度的异质性,导致患者的病理特征和临床结果差异极大,这使得治疗方案的制定变得异常困难,许多患者在接受治疗后仍会面临耐药或复发的困境。
与此同时,随着生命科学研究的不断深入,一些新的细胞死亡方式和分子机制逐渐进入人们的视野。铜死亡(Cuproptosis),作为一种新近被定义的调节性细胞死亡形式,与传统的细胞凋亡和坏死性凋亡有着截然不同的机制。它主要由细胞内铜积累驱动,铜与三羧酸(TCA)循环中的脂酰化蛋白结合,引发一系列连锁反应,最终导致细胞死亡。这一独特的细胞死亡途径揭示了铜稳态、线粒体代谢和细胞命运之间的紧密联系,为癌症研究带来了新的思路。

而长链非编码 RNA(lncRNA),这些曾经被认为是基因组 “暗物质” 的分子,近年来逐渐崭露头角。它们在癌症的发生、发展过程中发挥着重要的调控作用,影响着细胞增殖、凋亡以及对治疗的反应。然而,在 DLBCL 领域,lncRNA 与铜死亡之间的潜在联系却鲜为人知,这就像一片尚未被开垦的 “神秘大陆”,充满了未知和探索的价值。

为了揭开这片 “神秘大陆” 的面纱,探寻更有效的 DLBCL 治疗策略,南方医科大学深圳医院等机构的研究人员踏上了探索之旅。他们开展了一项基于机器学习的研究,旨在识别与 DLBCL 铜死亡相关的 lncRNA 生物标志物,并构建可靠的预后模型。这项研究成果发表在《Cell Biology and Toxicology》杂志上,为 DLBCL 的研究和治疗带来了新的曙光。

研究人员在此次研究中,运用了多种关键技术方法。首先,他们从癌症基因组图谱(TCGA)和基因表达综合数据库(GEO)中获取了 DLBCL 患者的 RNA 表达数据和临床信息,这些数据就像是研究的 “宝藏地图”,为后续的探索提供了重要线索。接着,他们使用了多种特征选择方法,如单变量过滤(Univariate Filtering)、套索回归(Lasso)、Boruta 算法和随机森林(Random Forest),从众多的 lncRNA 中筛选出关键的生物标志物。最后,他们基于 Transformer 架构构建了一个集成模型,并通过五折交叉验证对模型进行训练和验证,以确保模型的准确性和可靠性 。

下面让我们深入了解一下研究的具体结果:

  • 发现新的分子亚型:研究人员分析了 1134 个 lncRNA 和 17 个与铜死亡相关的基因,通过共表达分析确定了 126 个与铜死亡基因显著相关的 lncRNA。随后,利用非负矩阵分解(NMF)聚类分析,成功将 DLBCL 患者分为两个分子亚型。主成分分析(PCA)和生存分析进一步证实,这两个亚型在基因表达和预后方面存在显著差异。这一发现就像是为 DLBCL 患者绘制了一张更精细的 “分子地图”,有助于更准确地了解患者的病情和预后。
  • 肿瘤微环境和免疫检查点分析:研究人员利用多种算法对肿瘤微环境(TME)进行分析,发现两个亚型在某些免疫细胞群体上存在显著差异。例如,亚型 1 中活化的 CD4 记忆 T 细胞和 γδ T 细胞较多,免疫反应更为活跃;而亚型 2 中幼稚 B 细胞和静息 NK 细胞较多,免疫环境相对抑制。同时,他们还检测了免疫检查点基因的表达,发现不同亚型的免疫检查点表达存在差异,这为针对不同亚型的免疫治疗提供了潜在的靶点和依据。
  • 多算法特征选择策略:通过四种互补的特征选择技术,研究人员确定了不同方法筛选出的关键 lncRNA,并通过整合这些方法的结果,得到了一组具有代表性的关键 lncRNA。性能评估显示,不同方法在不同指标上各有优势,Boruta 算法在交叉验证得分和召回率方面表现出色,Lasso 回归的精度最高,随机森林在准确率和 F1 得分上表现优异。
  • 基于 Transformer 的模型预测:研究人员构建了基于 Transformer 架构的 Bagging 集成模型来预测风险评分。经过五折交叉验证,该模型在训练集和外部验证集上均表现出良好的预测性能,能够有效区分高风险和低风险患者。独立风险分析表明,风险评分是一个重要的生存预测指标,年龄也是一个显著的预测因素,而性别则不具有显著影响。
  • 关键预后 lncRNA 的表达分析:定量 PCR(qPCR)分析显示,MALAT1 在 DLBCL 细胞系中的表达显著高于对照细胞系。进一步的实验表明,敲低 MALAT1 能够抑制 DLBCL 细胞的增殖,这表明 MALAT1 在 DLBCL 细胞增殖中发挥着重要作用,有望成为潜在的治疗靶点。

在研究结论和讨论部分,研究人员指出,他们构建的基于铜死亡相关 lncRNA 的分子分类体系,为 DLBCL 的研究提供了新的视角和分类方法,有助于更深入地了解 DLBCL 的异质性和发病机制。同时,多机器学习策略有效地识别了关键 lncRNA,基于这些 lncRNA 构建的 Transformer - based Bagging 集成模型在预测 DLBCL 预后方面表现出色,具有潜在的临床应用价值。此外,MALAT1 作为一个关键的 lncRNA,其在 DLBCL 细胞增殖中的作用得到了验证,为 DLBCL 的治疗提供了新的潜在靶点。

然而,研究也存在一些局限性。例如,验证队列是回顾性的且来自公开数据库,需要前瞻性临床试验进一步验证;其他 lncRNA 的功能有待更多实验验证;模型仅基于转录组数据,未来可整合多组学数据以提高模型的预测准确性。尽管如此,这项研究依然为 DLBCL 的研究和治疗开辟了新的道路,为未来的研究指明了方向,有望推动 DLBCL 精准治疗的发展,为众多患者带来新的希望。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号