安徽中医药大学附属六安医院(Department of Medical Oncology, Lu’an Hospital Affiliated To Anhui University of Chinese Medicine)的研究人员 Wanhui Dong 等人,在《Scientific Reports》期刊上发表了题为 “To investigate the tumor promotion role of PLOD3 in colorectal cancer and its potential as a prognostic biomarker and therapeutic target” 的论文。这篇论文在结直肠癌(colorectal cancer,CRC)研究领域意义重大,为深入理解结直肠癌的发病机制、精准预后评估及靶向治疗提供了全新视角与关键依据。
研究背景
结直肠癌在全球范围内是常见癌症,也是癌症相关死亡的重要原因之一。据 GLOBOCAN 2020 数据显示,2020 年全球约有 190 万新发病例和 93 万死亡病例,且在高收入国家,年轻群体中的发病率呈上升趋势,给公共卫生带来了严峻挑战。目前,虽然中国临床肿瘤学会(CSCO)和美国国家综合癌症网络(NCCN)等制定的指南推荐了多种治疗方式,如手术切除、放疗、化疗和靶向治疗等,但早期检测和干预仍是提高患者生存率的关键。近年来,分子生物学技术的进步推动了众多生物标志物的发现和临床应用,显著提升了结直肠癌的诊疗水平。
PLOD3(procollagen-lysine, 2-oxoglutarate 5-dioxygenase 3)属于 PLOD 基因家族,编码赖氨酸羟化酶 3,参与胶原蛋白的翻译后修饰过程,对维持细胞外基质(extracellular matrix,ECM)的结构完整性至关重要。已有研究发现,PLOD3 在多种肿瘤中表达异常,可通过调节细胞外基质稳定性、促进肿瘤细胞侵袭性等方式参与肿瘤的发生和发展。然而,PLOD3 在结直肠癌中的具体作用机制、能否作为有效的诊断或治疗生物标志物等问题,仍有待深入探究。
研究方法
- 单细胞聚类和细胞注释分析:从 GEO 数据库检索单细胞数据集 GSE161277,筛选结直肠癌和正常组织样本。运用 R 包 Seurat(v5.1.0)对单细胞数据进行加载、预处理,计算线粒体基因比例,筛选合格细胞。随后进行对数归一化、批次效应校正,通过主成分分析(PCA)降维,利用相关函数进行细胞聚类和注释,并对标记基因开展功能富集分析。
- 细胞通讯和配体分析:借助 “CellChat” R 包(版本 1.6.0),基于单细胞数据和细胞分类,利用 “CellChatDB.human” 数据库,对细胞间通讯进行分析。
- 表达谱数据处理和分析:从 TCGA 数据库获取结直肠腺癌(colorectal adenocarcinoma,COAD)的表达谱数据及临床信息,从 GEO 数据库下载多个相关数据集并保留 GPL570 平台测序数据。运用 RMA 函数处理、归一化数据,映射探针与基因符号,整合数据集并校正批次效应,采用单样本基因集富集分析(ssGSEA)计算富集分数。
- 构建预后模型并评估性能:对 TCGA 数据集中的成纤维细胞标记基因进行单变量 Cox 回归分析,筛选与生存相关基因。以 TCGA 数据集为训练集,其他数据集为验证集,运用 36 种方法筛选最优模型,进行多变量 Cox 回归分析确定风险系数,计算风险评分,绘制生存曲线评估预测性能。结合临床数据构建列线图模型,通过校准、决策曲线分析(DCA)和受试者工作特征曲线(ROC)下面积(AUC)评估模型效能。
- 分析模型的免疫相关特性和功能:利用评估工具计算 Meta 数据集的基质评分、免疫评分和估计评分,比较高低风险组差异。识别免疫检查点相关基因,分析其与风险评分的相关性。对高低风险组进行差异表达基因(DEGs)分析和 KEGG 通路富集分析,运用 GSEA 函数进行 KEGG 通路富集分析。
- 探究模型在免疫治疗中的潜力:运用在线工具 TIDE 预测 Meta 数据集中的免疫治疗反应,分析风险评分与 TIDE 评分的相关性,比较高低风险组免疫治疗反应概率。开展亚组分析,对比 Meta 数据集与 IMvigor210 数据集的表达谱,计算其他免疫治疗相关数据集的风险评分,比较高低风险组免疫治疗反应者比例。利用 R 包 oncoPredict 基于 GDSC1 数据估计药物半数抑制浓度(IC50),分析其与风险评分的相关性。
- 模型基因与结直肠癌的孟德尔随机化分析:从 OPENGWAS 数据库获取 PLOD3 基因和结直肠癌的全基因组关联研究(GWAS)数据集,筛选数据后运用五种孟德尔随机化方法进行分析。
- 实验验证:培养正常肠上皮细胞(NCM460)和人结直肠癌细胞系(SW1116 和 Caco2),进行转染实验。提取 RNA 和蛋白质,分别进行定量逆转录聚合酶链反应(RT-PCR)和蛋白质免疫印迹(Western blot)分析。运用 Transwell 实验和划痕实验检测细胞迁移和侵袭能力,采用统计软件分析数据。
研究结果
- 数据整理与分析:通过对结直肠癌单细胞数据集的筛选和降维,识别出 24 个亚群,进一步分类得到 9 种细胞类型。功能富集分析揭示了标记基因的潜在生物学意义,且不同样本间细胞比例存在显著差异,肿瘤组织中上皮细胞比例(44%)高于正常组织(17%)。利用 CellChat 工具发现成纤维细胞在细胞通讯网络中起关键作用,涉及胶原信号通路和 CXCL 信号通路等。比较正常和肿瘤样本的成纤维细胞评分,发现正常样本中评分更高。
- 预后模型的构建与效果:从 TCGA 数据集中筛选出 57 个与成纤维细胞标记基因相关的生存基因,构建预后模型。经评估,采用 StepCox [backward] 方法选择的 12 个基因构建的模型平均 C-index 较高,公式为 RiskScore = 0.8921ABL2 + 0.2645AIF1L + 0.1339APOD - 0.3421BGN + 0.3051CD248 + 0.274CRIP2 - 0.6143NPR1 + 0.1456NR4A1 + 0.1928PCOLCE2 + 0.3098PLOD3 + 0.1424S100A4 - 0.5725USP53。该模型在多个数据集上具有良好的预测性能,且 RiskScore 在单变量和多变量分析中均显示出显著的预后预测能力。结合 T 分期、M 分期和 RiskScore 构建的列线图模型,经校准和 DCA、AUC 评估,证实了其在生存预测方面的高效性。
- 模型与免疫及功能的关联:比较 Meta 数据集中高低风险组的免疫微环境评分,发现高风险组免疫评分显著更高,且 RiskScore 与免疫评分呈正相关。免疫检查点基因表达与 RiskScore 大多呈正相关。差异基因表达分析和富集分析发现,高低风险组在多个信号通路存在显著差异,高风险组富集于 PI3K-Akt、NF-κB 等促癌通路,低风险组则富集于 DNA 修复相关通路。
- 模型与免疫治疗的潜在关联:TIDE 工具预测显示,低风险组 TIDE 评分更低,更适合免疫治疗,其免疫治疗反应样本比例达 62%,且低风险组与 PD-L1 治疗的部分缓解(PR)反应组相关性显著。在其他免疫治疗数据集 GSE78220 和 GSE135222 中,低风险组的 PR/CR 比例更高。分析药物 IC50 与 RiskScore 的相关性,发现 38 种药物与之显著相关,其中 24 种呈正相关,14 种呈负相关。
- 模型基因与结直肠癌的孟德尔随机化分析:对 PLOD3 基因的孟德尔随机化分析表明,其与结直肠癌呈正相关,可能是结直肠癌的风险因素,五种分析方法的优势比(OR)均大于 1。
- 模型基因的实验验证:体外细胞实验证实,SW1116 和 Caco2 细胞中 PLOD3 的 mRNA 和蛋白质水平显著高于正常 NCM460 细胞。敲除 PLOD3 后,肿瘤细胞的迁移和侵袭能力明显受损。
研究结论与讨论
本研究表明,PLOD3 在结直肠癌的发生、发展中起着关键作用,不仅促进肿瘤细胞的迁移和侵袭,还可能通过调节肿瘤微环境中的免疫反应影响免疫治疗效果。这一发现具有重要的临床意义,PLOD3 有望作为新型生物标志物纳入结直肠癌的分子诊断和预后评估体系,基于 PLOD3 的联合治疗方案,如与现有免疫疗法结合,可能为患者提供更精准、有效的治疗选择。
研究人员通过单细胞聚类分析精确描绘了结直肠癌肿瘤微环境中细胞的异质性,揭示了 PLOD3 在特定细胞类型中的潜在作用。细胞通讯分析显示,PLOD3 可能通过调节肿瘤细胞与免疫细胞间的相互作用影响肿瘤进展,为基于 PLOD3 的免疫治疗开发提供了理论依据。多数据集整合和模型构建进一步验证了 PLOD3 作为预后标志物的可靠性,且发现其与免疫相关通路密切相关,增强了其临床应用潜力。
在未来研究中,为进一步验证 PLOD3 抑制剂在结直肠癌治疗中的效果,提升研究的临床转化价值,可采用 CRISPR/Cas9 基因编辑技术在异种移植模型中敲除 PLOD3 基因,观察其对肿瘤生长和转移的影响。同时,开发针对 PLOD3 的小分子抑制剂或单克隆抗体,并进行药代动力学(PK)分析和最大耐受剂量(MTD)评估,初步验证药物疗效。利用转录组学(RNA-seq)、蛋白质组学(LC-MS/MS)和代谢组学(LC-MS 或 GC-MS)等多组学技术,深入探究 PLOD3 抑制对肿瘤相关信号通路、胶原蛋白修饰和肿瘤代谢调控的影响机制。此外,借助液体活检技术,如检测外泌体 RNA 和循环肿瘤 DNA,动态监测治疗效果和耐药机制,为结直肠癌的精准治疗提供更坚实的数据支持。