编辑推荐:
结直肠癌(CRC)严重威胁人类健康。为探究 PLOD3 在 CRC 中的作用及潜在价值,研究人员分析多组数据并实验验证。结果发现 PLOD3 在 CRC 组织高表达,影响患者预后,可作为预后标志物和治疗靶点,为 CRC 诊疗提供新方向。
在癌症的世界里,结直肠癌(Colorectal Cancer,CRC)是一个不容忽视的 “狠角色”。它在全球癌症排行榜中位居第三,还是癌症相关死亡的第二大 “元凶”。据 2020 年 GLOBOCAN 数据显示,当年全球新发病例约 190 万,死亡人数达 93 万,并且在高收入国家,年轻群体中的发病率呈上升趋势。当前,虽然有手术、放疗、化疗和靶向治疗等手段,但早期发现和干预依旧是提高患者生存率的关键。近年来,分子生物学技术的进步让众多生物标志物被发现并应用于临床,为 CRC 的诊疗带来新希望。不过,PLOD3(procollagen - lysine, 2 - oxoglutarate 5 - dioxygenase 3,参与胶原蛋白翻译后修饰的关键酶)在 CRC 中的具体作用、潜在的诊断和治疗价值,却还是谜团,亟待解开。
为了攻克这些难题,安徽中医药大学附属六安医院和皖西卫生职业学院附属医院的研究人员挺身而出,开展了一项意义重大的研究。他们围绕 PLOD3 在 CRC 中的角色、作为预后生物标志物和治疗靶点的潜力展开深入探索。研究发现,PLOD3 在 CRC 组织中显著高表达,而且高表达与患者预后不良、总生存率降低密切相关。研究人员还构建了包含 PLOD3 和其他 11 个基因的 RiskScore 模型,这个模型对患者预后有很强的预测能力。功能实验证实,PLOD3 过表达会增强 CRC 细胞的迁移和侵袭能力。此外,研究还揭示了 PLOD3 高表达与上皮 - 间质转化(Epithelial - Mesenchymal Transition,EMT)和转移相关通路的激活有关。这一研究成果发表在《Scientific Reports》上,为 CRC 的诊疗开辟了新思路,有望让患者迎来更精准有效的治疗。
研究人员为开展这项研究,用到了多个关键技术方法。从公共数据库(如 GEO、TCGA)获取单细胞数据集和表达谱数据;运用 R 语言的 Seurat 包进行单细胞聚类、注释分析,CellChat 包分析细胞间通讯;通过单样本基因集富集分析(ssGSEA)计算富集分数;构建预后模型时采用单因素和多因素 Cox 回归分析;利用 Mendelian 随机化分析探究基因与 CRC 的关联;最后通过体外细胞实验,如细胞培养、转染、RNA 提取及定量逆转录聚合酶链反应(RT - PCR)、蛋白质提取及 Western blot 分析、Transwell 实验和划痕实验等进行验证。
数据整理与分析
研究人员从结直肠癌单细胞数据集入手,经过筛选和降维,识别出 24 个亚群。依据先前研究确定的标记,区分出多种细胞类型,像上皮细胞、成纤维细胞、巨噬细胞等,并将细胞进一步分为 9 种类型。通过功能富集分析,挖掘标记基因的潜在意义。在 COAD 样本中,发现细胞类型比例在不同样本间差异显著,还揭示了复杂的细胞间通讯网络,其中成纤维细胞在通讯中似乎起着关键作用。此外,对比正常和肿瘤样本的成纤维细胞得分,发现正常样本得分更高。
预后模型的构建与效果评估
在 TCGA 数据集中筛选出 57 个与成纤维细胞标记基因相关的生存基因,利用训练集和验证集构建模型。经多因素 COX 回归分析和不同机器学习方法评估,最终确定 12 个基因构建预后模型,公式为 RiskScore = 0.8921×ABL2 + 0.2645×AIF1L + 0.1339×APOD - 0.3421×BGN + 0.3051×CD248 + 0.274×CRIP2 - 0.6143×NPR1 + 0.1456×NR4A1 + 0.1928×PCOLCE2 + 0.3098×PLOD3 + 0.1424×S100A4 - 0.5725×USP53。该模型在多个数据集上,通过计算 KM 曲线和 ROC 曲线,展现出良好的预测性能。而且,RiskScore 在单因素和多因素分析中都有显著的预后预测能力,纳入 T 分期、M 分期和 RiskScore 构建的列线图模型,经校准和决策曲线分析(DCA)等验证,预测效果出色。
模型与免疫及功能的关联
比较 Meta 数据集中高风险和低风险组的免疫微环境得分,发现高风险组免疫得分更高,且 RiskScore 与免疫得分显著正相关。分析免疫检查点基因,发现多数与 RiskScore 呈正相关。对高低风险组进行差异基因表达分析,找到 1923 个差异表达基因,富集分析显示这些基因涉及多个信号通路。基因集富集分析(GSEA)表明,高风险组在 PI3K - Akt、NF - κB 等多个促进肿瘤发展的通路显著富集,低风险组则在 DNA 修复相关通路富集。
模型与免疫治疗的潜在关联
使用 TIDE 工具预测免疫治疗反应,发现低风险组 TIDE 得分更低,更适合免疫治疗,且 RiskScore 与 TIDE 得分正相关。对比 Meta 数据集和 PD - L1 治疗的临床基因集,发现高风险组与 PD 和 SD 反应组相关,低风险组与 PR 反应组相关。在另外两个免疫治疗数据集计算风险得分,发现低风险组 PR/CR 比例更高。分析药物 IC50 与 RiskScore 的关系,筛选出 38 种显著相关药物,部分呈正相关,部分呈负相关。
模型基因与 CRC 的孟德尔随机化分析
在 OPENGWAS 数据库中,仅 PLOD3 有全基因组关联研究(GWAS)数据。对 PLOD3 进行孟德尔随机化分析,多种方法显示 PLOD3 与 CRC 呈正相关,表明它可能是 CRC 的风险因素。
模型基因的实验验证
体外细胞实验显示,SW1116 和 Caco2 细胞中 PLOD3 的 mRNA 和蛋白质水平比正常 NCM460 细胞显著上调。敲除 PLOD3 后,肿瘤细胞的迁移和侵袭能力受损,Transwell 实验中 si - PLOD3 组细胞数量减少,划痕实验中伤口愈合速度减慢。
研究表明,PLOD3 在 CRC 的发生、发展中扮演重要角色,还可能调节肿瘤微环境中的免疫反应,影响免疫治疗效果。这一发现为 CRC 的分子诊断和预后评估提供了新的生物标志物,基于 PLOD3 的联合治疗或许能提高疗效,为患者带来更个性化、精准的治疗方案。未来,可借助 CRISPR/Cas9 基因编辑技术、开发靶向 PLOD3 的小分子抑制剂或单克隆抗体,结合多组学技术和液体活检技术,进一步深入研究,推动基础研究成果向临床应用转化,为攻克 CRC 带来更多希望。