乳腺癌研究新突破:预测三阴及 HER2 阳性乳腺癌复发与生存的精准模型

《Molecular Therapy Oncology》:Transcriptome analysis reveals the potential role of neural factor EN1 for long-terms survival in estrogen receptor-independent breast cancer

【字体: 时间:2025年03月23日 来源:Molecular Therapy Oncology 5.3

编辑推荐:

  本文构建了早期复发指数(ERI)预测模型,能精准预测雌激素受体阴性(ERneg)乳腺癌患者 10 年生存率。

  

引言

乳腺癌作为严重威胁全球女性健康的疾病,其新发病例和死亡人数持续攀升。尽管化疗、靶向治疗和免疫治疗等多种手段使乳腺癌患者的治疗效果有所改善,但三阴乳腺癌(TNBC)患者仍面临诸多挑战。
TNBC 患者不表达雌激素受体(ER)、孕激素受体,且人表皮生长因子受体 2(Her2/ErbB2)也不高表达,这使得内分泌治疗和 Her2 靶向治疗对其效果不佳。同时,TNBC 肿瘤微环境(TME)更为复杂和异质,缺乏有效的治疗靶点。大部分 TNBC 患者复发和死亡源于耐药,目前 TNBC 的治疗主要依赖化疗和免疫治疗,但新辅助免疫治疗仅对早期 TNBC 患者有效,晚期 TNBC 患者的联合治疗效果不理想。
为解决这些问题,研究人员收集了 155 例 TNBC 患者的癌组织和癌旁组织进行 RNA 测序(RNA-seq)分析,旨在找出与复发相关的基因表达模式和核心基因,构建预测模型,并探索其潜在的生物学机制,为 TNBC 患者的精准治疗提供依据。

结果

三阴乳腺癌患者早期复发或长期无复发状态的临床特征和转录组分析

研究人员收集了 155 例 TNBC 患者的详细随访数据,其中 65 例在术后 10 年内出现局部复发或远处转移(复发组,RE),34 例无复发存活(非 RE 组),56 例未满足上述分组条件的患者用于生存分析。
临床信息分析显示,RE 组和非 RE 组患者在年龄、T 分期、N 分期、P53 和 KI-67 染色以及是否接受化疗等方面无显著差异。但生存分析表明,RE 组患者的无复发生存期(RFS)和总生存期(OS)明显较差。
转录组分析发现,癌组织和癌旁组织的转录组特征存在明显差异。对 RE 组和非 RE 组患者的癌组织和癌旁组织进行差异表达基因(DEG)分析,分别得到 964 个和 1,057 个 DEG;比较两组患者配对的癌组织和癌旁组织,又分别鉴定出 856 个和 770 个 DEG。这些 DEG 的交集揭示了一些共同基因,如免疫球蛋白 IGHV1-69 和感觉神经元蛋白促动力素 2 受体(PROKR2)。基因集富集分析(GSEA)显示,RE 组和非 RE 组患者的癌组织和配对癌旁组织中,激素和神经元相关通路存在差异富集。
进一步的 Mfuzz 分析基于 DEG 发现了四种表达模式,与早期复发事件潜在相关。基因本体生物学过程(GOBP)分析表明,与早期复发相关的 C1 和 C4 模式中的 DEG,在神经元增殖、分化和信号转导相关通路中富集。由此推测,神经功能可能在 TNBC 复发中发挥作用。

基于复发相关 DEG 构建预后模型

为深入探究上述 DEG 在预测早期复发和生存方面的潜力,研究人员收集了 11 个独立公共数据库的转录组数据,构建了 Gene Expression Omnibus(GEO)队列,并整合其他数据生成 Meta_BC 数据集,包含 7,231 例乳腺癌患者。从该数据集中筛选出 TNBC 患者,建立训练队列(n = 942)和测试队列(n = 400)。
研究人员采用基于机器学习的集成模型,结合 10 种算法构建预后模型。结果显示,Cox 回归结合随机森林算法在预测 TNBC 患者 OS 方面最为有效。基于该模型得到的风险评分,即早期复发指数(ERI),与 TNBC 患者的预后显著相关。以 ERI 中位数分层,ERIHigh的 TNBC 患者 OS 和 RFS 明显差于 ERILow的患者,且在不同数据库中均得到验证。
此外,研究人员还探究了 ERI 与其他乳腺癌亚型的关系,发现除 Her2 亚型外,ERIHigh和 ERILow患者在其他亚型中的预后差异不显著。在 Her2 亚型中,ERIHigh患者的预后也较差,这表明模型中的基因可能将 TNBC 和 Her2 这两种 ERneg 乳腺癌亚型的发生联系起来。

ERIHigh的 ERneg 患者化疗时复发风险更高

化疗是提高乳腺癌患者预后的重要手段,但 ERI 评分与化疗疗效的关系尚不明确。研究人员对接受和未接受化疗的 TNBC 和 Her2 患者进行分析,发现高 ERI 的 TNBC 患者,无论是否接受化疗,预后均较差;在 Her2 患者中,接受化疗的 ERIHigh患者 RFS 和 OS 较短,而未接受化疗的患者则无此关联。
将 TNBC 和 Her2 阳性患者合并为 ERneg 队列后发现,ERIHigh患者无论是否接受化疗,预后都较差,且接受化疗的 ERIHigh患者 RFS 明显短于未接受化疗者,而 ERILow患者则无此差异,这表明 ERI 基因在化疗反应中起重要作用。

基于 ERI 的列线图有效预测 ERneg 乳腺癌患者的长期生存

此前缺乏基于转录组的乳腺癌患者长期生存预测模型。研究人员在 ERneg 患者训练队列中进行单变量和多变量 Cox 回归分析,发现 ERI、年龄和 N 分期是与生存相关的重要因素。
基于这些因素,研究人员构建了列线图来预测患者的 OS。该列线图在训练队列和测试队列中的 C 指数分别为 0.756(95% 置信区间 [CI],0.732 - 0.782)和 0.746(95% CI,0.710 - 0.783),校准曲线显示其能准确预测 3 年、5 年和 10 年生存率。决策曲线分析(DCA)表明,列线图模型在预测 10 年生存率方面优于其他预测指标。
基于列线图评分,高评分(scoreHigh)和低评分(scoreLow)患者的 OS 存在显著差异,且在 ERneg 队列中,无论患者是否接受化疗,该差异均存在。列线图模型预测 10 年 OS 的曲线下面积(AUC)大于 0.79,在五个独立队列中也显示出较高的预测准确性,但对 ER 阳性(ERpos)乳腺癌患者的 RFS 和 OS 预测效果不佳。

ERIHigh患者表现出增强的神经调节功能和降低的免疫反应

虽然 ERI 是预测 ERneg 乳腺癌患者长期生存的关键指标,但其潜在生物学机制尚不清楚。研究人员对 ERI 相关基因进行蛋白质 - 蛋白质相互作用(PPI)分析,发现多个相互作用蛋白,其功能与免疫反应、细胞外基质形成和神经管发育相关。
比较 ERIHigh和 ERILow患者的 DEG,发现 ERIHigh组的共同 DEG 在轴突发生、管形成和子宫内胚胎发育等神经相关通路中富集;而 ERILow组的共同 DEG 与免疫反应激活相关,如细胞杀伤。GSEA 分析也显示,ERIHigh组多个神经相关通路显著富集,而免疫反应通路在 ERILow组富集。
此外,基因集变异分析(GSVA)表明,突触前去极化、钙通道开放以及 S1P 通路在 ERIHigh的 TNBC 和 Her2 患者中分别富集,而免疫反应通路在 ERILow组富集。这些结果表明,ERIHigh患者的肿瘤组织神经调节功能增强,免疫反应降低。

ERI 和核心基因与免疫抑制和神经元浸润相关

研究发现,上皮 - 间质转化(EMT)过程和癌症干性增强与癌症患者的复发和转移有关,但 ERILow和 ERIHigh的 ERneg、TNBC 或 Her2 肿瘤患者在 EMT 和干性评分上无显著差异。
研究人员转而研究 TME 与 ERI 的关系,使用七种反卷积算法分析发现,ERI 评分越高,免疫细胞浸润增加。Cibersort 分析显示,ERILow患者的抗肿瘤免疫细胞(如 CD8+T 细胞、活化的 CD4+T 细胞和 M1 巨噬细胞)浸润水平较高,而 ERIHigh患者的调节性 T 细胞和中性粒细胞浸润增加。
相关性分析表明,ERI 与多种反卷积算法计算的浸润评分显著相关,其中抗肿瘤免疫细胞与 ERI 呈显著负相关,而神经元浸润评分与 ERI 呈正相关。Mantel 测试分析进一步表明,神经元浸润与上述免疫细胞呈负相关。
ERI 的核心基因,如 C-X-C 基序趋化因子配体 11(CXCL11)、软骨寡聚基质蛋白(COMP)和 EN1,对免疫细胞浸润有显著影响。EN1 与 TNBC 和 Her2 患者的不良预后相关,且与多种免疫细胞的浸润相关,根据 Mantel 测试分析,EN1 与多种免疫细胞浸润显著相关。

单细胞转录组分析确定肿瘤细胞中的 EN1 是调节 B 细胞的关键因素

为研究 ERI 核心基因的表达,研究人员分析了来自 GSE176078 和 GSE161529 数据库的 ERneg 乳腺癌患者单细胞 RNA 测序(scRNA-seq)数据。经过严格的质量控制和数据整合,保留了 137,032 个细胞进行后续分析,鉴定出 38 个细胞簇,分为上皮细胞、T/NK 细胞、B 细胞、浆细胞、髓样细胞、内皮细胞和成纤维细胞七种细胞类型,通过 InferCNV 分析确认上皮细胞为肿瘤细胞。
研究发现,CXCL11 和 COMP 主要在髓样细胞和成纤维细胞中表达,而 EN1 主要在肿瘤细胞中表达。由于 EN1 与免疫细胞浸润尤其是 B 细胞相关,研究人员进一步研究了 EN1 表达的肿瘤细胞与 B 细胞的关系。
将肿瘤细胞根据 EN1 表达水平分为 EN1High和 EN1Low组,分析肿瘤细胞、B 细胞和浆细胞之间的配体 - 受体相互作用,发现多个相互作用,其中 MIF(CD74 - CXCR4)信号通路是最显著的通信模式。肿瘤细胞尤其是 EN1High肿瘤细胞是 MIF 信号向 B 细胞传递的主要来源,且该通路在 EN1High肿瘤细胞与 B 细胞的相互作用中更为突出。
利用 Kaplan-Meier Plotter 网站分析发现,在黑色素瘤等非上皮来源肿瘤中,EN1 与免疫治疗反应不佳相关;在尿路上皮癌中,男性高 EN1 表达与不良预后相关,女性高 EN1 表达则与免疫治疗最佳反应相关,这表明 EN1 在免疫治疗反应中可能发挥作用。

讨论

TNBC 和 HER2 乳腺癌由于耐药、早期复发和远处转移,给治疗带来了巨大挑战。本研究通过比较 TNBC 患者短期和长期 RFS 的 DEG,确定了与复发相关的基因,构建的预后模型不仅对 TNBC 患者有效,对 HER2 患者也有较好的预测效果,且在预测长期生存方面优于以往基于 T 细胞、免疫特征和细胞死亡相关基因的模型。
研究还发现神经相关通路可能与 TNBC 复发有关,虽然 PROKR2 未被纳入预后模型,但鉴定出另一个神经相关基因 EN1。EN1 在多种生物学发育过程中起重要作用,在肿瘤发生和进展中的作用也逐渐受到关注。在乳腺癌中,EN1 促进 TNBC 的转移,且与多种免疫细胞浸润相关。
虽然 ERI 评分与抗肿瘤免疫浸润呈负相关,但 EN1 作为潜在的免疫治疗生物标志物具有重要意义。EN1 在不同性别癌症患者的免疫治疗反应中表现出不同的关联,这为其临床应用提供了新的思路。尽管 EN1 作为转录因子,设计靶向治疗存在挑战,但探索其在免疫治疗中的不同作用有望推动临床应用。

材料和方法

患者信息和样本收集

2011 年至 2015 年,哈尔滨医科大学附属肿瘤医院从 155 例经组织学确诊的 TNBC 女性患者中收集了 285 份样本,包括 147 份癌组织和 138 份癌旁组织。这些患者均接受过手术和辅助治疗,根据 10 年内是否复发分为 RE 组和非 RE 组。样本在手术过程中采集并储存于 - 80°C。本研究经哈尔滨医科大学附属肿瘤医院伦理委员会批准,患者均签署了书面知情同意书。

文库构建、质量控制和转录组分析测序

以总 RNA 为起始材料,使用 NEBNext Ultra RNA Library Prep Kit for Illumina 试剂盒构建测序文库。具体步骤包括 mRNA 纯化、片段化、第一和第二链 cDNA 合成、cDNA 片段腺苷酸化、连接接头、纯化筛选片段、USER 酶处理和 PCR 扩增。使用 Agilent 5400 系统评估文库质量,QPCR 定量。合格文库在 Illumina 平台上以 PE150 策略进行测序。

RNA-seq 原始数据质量控制

Illumina 平台产生的原始荧光图像文件经碱基识别转换为短读长(原始数据),记录在 FASTQ 格式中。使用 Fastp(版本 0.19.7)对原始读长进行质量控制,丢弃含有接头污染、不确定碱基比例超过 10% 或低质量(Phred 质量 < 5)碱基比例大于 50% 的配对读长。

公共批量转录组数据收集和整合

收集多个来源的微阵列数据,包括 GSE12276、GSE16446 等,构建 GEO 队列。同时下载 Metabric 微阵列数据、TCGA-BRCA 的 RNA-seq 计数数据和 SCAN_B 数据,生成 Meta_BC 队列。使用 R(版本 4.3)进行转录组数据分析,利用 “sva” 包的 combat 函数消除批次效应,“IOBR” 包进行转录本每百万(TPM)标准化和主成分分析(PCA)。

DEG 和通路富集分析

使用 R 中的 “DEseq2” 包(版本 1.42.1)分析 RNA-seq 数据中的 DEG,“limma” 包(版本 3.58.1)分析微阵列数据中的 DEG。将调整 p 值小于 0.05 且绝对 log2 倍变化大于 2.5 的基因视为 DEG。利用分子签名数据库(“msigdb”,版本 7.5.1)进行血浆蛋白的全局通路分析,使用 “ReactomePA” 包(版本 1.46.0)进行 Reactome 通路分析,“clusterProfiler” 包(版本 4.12.3)进行排序 GSEA 和 GSVA 分析。

复发相关基因的模式表达分析

使用 “Mfuzz” 分析 RE 和非 RE 患者中 DEG 的表达模式,“GseaVis” 进行结果可视化。Mfuzz 分析采用默认参数将 DEG 分类为不同簇,对每个簇的 DEG 进行 GOBP 通路富集分析,并计算每个蛋白质在簇中的成员得分。

预后模型构建和生存分析

将 1,342 例有结局信息的 TNBC 患者按 7:3 的比例随机分为训练队列(n = 942)和测试队列(n = 400)。使用 R 包 “Mime1”(版本 0.0.0.9000)中的 10 种机器学习算法构建预后模型,计算得到的风险评分即为 ERI。计算 Meta_BC 队列中所有患者的 ERI,并根据各队列中 ERI 的平均值将患者分为 ERIHigh和 ERILow组,使用 “survival”(版本 3.7 - 0)和 “survminer”(版本 0.4.9)包绘制 Kaplan-Meier 生存曲线。
将 TNBC 和 Her2 患者合并为 ERneg 队列,按 7:3 的比例随机分为训练队列(n = 1,302)和剩余队列(n = 550)。使用 “forestmodel” 包(版本 0.6.2)进行单变量和多变量 Cox 回归分析,确定预测 OS 的独立因素。利用 “rms” 包(版本 6.7 - 0)构建预测 ERneg 患者 OS 的列线图和校准曲线,“ggDCA” 包(版本 1.2)计算和绘制 DCA。使用 Kaplan-Meier Plotter 网站(http://kmplot.com)进行免疫治疗的生存分析。

PPI 和 TME 分析

使用 STRING 数据集(版本 12.0)对 ERI 基因进行 PPI 分析,对每个簇的相互作用蛋白进行 GOBP 分析,选择前五个富集通路进行可视化,使用 Cytoscape(版本 3.9.1)展示 PPI、重要性和通路富集情况。使用 “IOBR” 包(版本 0.99.8)中的多种算法(如 Cibersort、EPIC、Estimate、IPS、MCP_counter、TIMER 和 xCell)计算 TME 成分的浸润评分。

相关性分析和 Mantel 测试分析

使用 Spearman 相关性评估单个 TME 成分与 ERI 的相关性,使用 “corrplot”(版本 0.92)和 “ggcorrplot”(版本 0.1.4.1)包进行结果可视化,Spearman 相关系数 | R|>0.4 且 p 值小于 0.05 被认为具有显著相关性。使用 “linkET” 包(版本 0.0.7.4)进行 Mantel 测试分析。

单细胞 RNA-seq 数据整合和分析

从 GEO 数据库下载 scRNA-seq 数据,使用 “Seurat<

涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒

10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�

娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功

鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�

涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�

相关新闻
    生物通微信公众号
    微信
    新浪微博

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号