基于机器学习构建凝血相关特征谱预测肺腺癌预后与治疗获益
《Hormones & Cancer》:Machine learning-based coagulation-related signature for predicting the prognosis and therapy benefits in lung adenocarcinoma
【字体:
大
中
小
】
时间:2025年12月10日
来源:Hormones & Cancer
编辑推荐:
本研究针对肺腺癌(LUAD)患者静脉血栓栓塞(VTE)发生率高且与不良预后相关,以及凝血系统与肿瘤免疫微环境(TME)相互作用机制不清的问题,开展了基于凝血相关基因(CRGs)的分子分型与预后模型构建研究。研究人员通过共识聚类识别出两个具有显著预后差异的CRGs相关亚型,并利用LASSO算法开发了一个包含20个基因的预后特征谱。结果表明,该特征谱能有效预测LUAD患者的总生存期(OS),并在独立数据集中得到验证,其预测性能优于现有多个模型。所构建的列线图具有良好的临床应用潜力。该研究为LUAD的预后评估及化疗、靶向治疗和免疫治疗策略的选择提供了新的生物标志物和分层工具。
在肺癌的各种亚型中,肺腺癌(Lung Adenocarcinoma, LUAD)不仅发病率高,还有一个令人困扰的特点——它更容易并发静脉血栓栓塞(Venous Thromboembolism, VTE)。VTE是恶性肿瘤常见的并发症之一,一旦发生,可能引发血栓或出血等严重问题,甚至成为导致患者死亡的主要原因。对于肺腺癌患者而言,VTE的发生往往预示着更差的临床结局。然而,其背后的发病机制尚不完全清楚。近年来,越来越多的证据表明,凝血系统与肿瘤免疫微环境(Tumor Microenvironment, TME)之间存在复杂的相互作用,这种相互作用不仅调控着肿瘤的进展,甚至可能影响肿瘤对免疫治疗的反应。例如,口服抗凝药利伐沙班与免疫检查点抑制剂(Immune Checkpoint Blockers, ICB)联用,已被发现能够增强抗原特异性的抗肿瘤免疫力。这提示我们,凝血相关基因(Coagulation-Related Genes, CRGs)可能在肺腺癌的预后和治疗应答中扮演着关键角色。然而,关于CRGs在肺腺癌中的系统性研究仍然有限。为了解决这一问题,研究人员开展了一项基于机器学习的研究,旨在深入探索CRGs在肺腺癌中的价值。
为了完成这项研究,作者们主要运用了以下几种关键技术方法:从分子特征数据库和既往文献中收集了139个CRGs;利用癌症基因组图谱(The Cancer Genome Atlas, TCGA)和基因表达综合数据库(Gene Expression Omnibus, GEO)中的肺腺癌数据集(包括GSE30219和GSE31210)作为训练和验证队列;通过共识聚类分析(Consensus Clustering)对肺腺癌患者进行分子分型;使用LASSO Cox回归算法构建预后特征模型(Prognostic Signature);并利用ESTIMATE算法、CIBERSORT反卷积法以及癌症免疫图谱(The Cancer Immunome Atlas, TCIA)数据库系统评估了肿瘤微环境特征和免疫治疗应答潜力;最后,结合风险评分和临床病理特征构建了预测总生存期的列线图(Nomogram)。
The expression and genetic mutation atlas of CRGs in LUAD.
研究人员首先分析了CRGs在肺腺癌中的表达和遗传变异图谱。与正常肺组织相比,共有46个CRGs表达上调,61个CRGs表达下调。在体细胞单核苷酸变异(Single Nucleotide Variant, SNV)方面,F8(9%)、LRP1(6%)和PLG(5%)的突变频率最高,且错义突变是最常见的变异类型。在拷贝数变异(Copy Number Variation, CNV)分析中,CTSK和S100A13的CNV频率最高,并且超过一半的CRGs存在广泛的CNV扩增。这些结果表明CRGs在肺腺癌中存在着显著的表达失调和遗传改变。
Consensus clustering identified two CRGs-related clusters in LUAD
基于差异表达的CRGs,研究团队通过共识聚类分析将肺腺癌患者划分为两个不同的分子亚型(Cluster 1和Cluster 2)。生存分析显示,Cluster 1的患者总生存期显著优于Cluster 2的患者。除了性别之外,两个簇在其他临床特征上没有显著差异。进一步分析发现,两个簇的肿瘤突变负荷(Tumor Mutation Burden, TMB)没有显著差异,且TP53、TTN、MUC16、CSMD3和RYR2在两个簇中都是突变频率最高的前五个基因。
Two CRGs-related clusters correlated with different signal pathways and biological effects
为了探究两个簇在生物学行为上的差异,研究人员对簇间差异表达基因进行了功能富集分析。基因集富集分析(Gene Set Enrichment Analysis, GSEA)结果显示,Cluster 2的基因集显著富集于补体和凝血级联反应(Complement and Coagulation Cascades)等通路,这提示Cluster 2的患者可能更容易发生静脉血栓栓塞,这或许是导致其预后较差的原因之一。
TME and therapeutic response analysis in different CRG-related clusters
肿瘤微环境分析揭示了两个簇的显著差异。与Cluster 2相比,Cluster 1的患者具有更高的免疫评分(Immunoscore)、基质评分(Stromascore)和ESTIMATE评分,表明其肿瘤微环境中免疫细胞和基质细胞的浸润更为丰富。具体而言,Cluster 1中记忆B细胞、静息CD4+记忆T细胞、单核细胞、M2巨噬细胞、静息树突状细胞和静息肥大细胞等免疫细胞的浸润水平更高。此外,Cluster 1在I/II型干扰素(IFN)反应、肿瘤浸润淋巴细胞(Tumor-Infiltrating Lymphocytes, TIL)、副炎症反应和细胞溶解活性等免疫相关功能上的评分也更高,并且这些功能的高评分与良好的预后相关。更重要的是,Cluster 1中人类白细胞抗原(Human Leukocyte Antigen, HLA)相关基因和免疫检查点(如PD-1/PD-L1)的表达水平普遍更高。免疫表型评分(Immunophenoscore, IPS)分析进一步证实,Cluster 1的患者对抗PD-1以及抗PD-1/CTLA-4联合免疫治疗可能具有更好的应答效果。综合这些特征,Cluster 1可以被归类为“免疫炎症型”(Immune-inflamed)或“热”肿瘤,而Cluster 2则更接近“免疫豁免型”或“免疫荒漠型”肿瘤。在化疗和靶向治疗方面,Cluster 2患者对阿法替尼、克唑替尼、厄洛替尼、吉非替尼、5-氟尿嘧啶、顺铂、多西他赛等多种药物的预估半数抑制浓度(IC50)显著低于Cluster 1,提示Cluster 2患者可能对这些常规治疗更为敏感。
Construction and validation of CRGs-related prognostic signature for LUAD
通过单变量Cox回归分析,研究人员筛选出32个与肺腺癌预后显著相关的CRGs。随后,利用LASSO Cox回归算法,最终构建了一个包含20个关键基因(F2, SERPINE1, F12, F9, BMP1, FURIN, TIMP1, CTSV, CTSH, RGN, GP9, KLK8, MEP1A, GNG12, MAFF, APOC2, ITGA2, RAC1, DPP4, PDGFB)的预后特征模型。根据风险评分的中位值,患者被分为高风险组和低风险组。在TCGA训练集以及GSE30219和GSE31210验证集中,低风险组患者的总生存期均显著优于高风险组。该模型预测1年、3年和5年生存率的受试者操作特征曲线(Receiver Operating Characteristic Curve, ROC曲线)下面积(Area Under the Curve, AUC)在TCGA队列中分别达到0.738、0.729和0.690,显示出良好的预测性能。多变量Cox回归分析证实,该风险评分是独立于临床分期的预后预测因子。一致性指数(C-index)分析和ROC曲线比较均表明,该CRGs预后特征的预测效能优于年龄、性别、分期等传统临床指标。
Comparison of CRGs prognostic model with other existing models
研究团队还将本研究的CRGs预后模型与已有的七个基因标志、十八个端粒长度相关基因标志、四个缺氧相关基因标志等八个已发表的肺腺癌预后模型进行了比较。结果显示,本模型的一致性指数(0.703)高于所有其他对比模型,且其在超过8年的预测时间范围内表现出最佳的预测性能,证明了该CRGs模型在预后预测上的优越性。
Construction of survival prediction nomogram in LUAD
为了便于临床实际应用,研究人员整合了CRGs风险评分和临床分期等预后因素,构建了一个预测肺腺癌患者1年、3年和5年总生存率的列线图。校准曲线显示该列线图的预测结果与实际观察值具有良好的一致性。决策曲线分析(Decision Curve Analysis, DCA)进一步表明,该列线图在TCGA和GEO数据集中均具有较高的临床净获益,显示出强大的临床应用潜力。
Risk score-based treatment strategy for LUAD
最后,研究探讨了风险评分在指导治疗策略方面的价值。分析发现,风险评分与静息树突状细胞、静息肥大细胞和单核细胞的浸润水平呈负相关。免疫表型评分(IPS)显示,低风险患者对抗PD-1、抗CTLA-4以及联合免疫治疗有更好的应答潜力。在接受了抗PD-L1治疗的IMvigor210队列中进行的验证也表明,高风险患者的总生存期更差。同时,高风险组对克唑替尼、厄洛替尼、顺铂、多西他赛等靶向药物和化疗药物的IC50值更低,提示其可能从这些治疗中获益更多。这些结果共同说明,低风险患者可能更适合免疫治疗,而高风险患者则可能对靶向治疗和化疗更敏感。
4. Discussion and 5. Limitations and 6. Conclusion
本研究成功识别出两个基于凝血相关基因的肺腺癌分子亚型,并开发并验证了一个强大的20基因预后特征模型。Cluster 1(“热”肿瘤)表现出丰富的免疫细胞浸润、高水平的免疫检查点分子表达和对免疫治疗更好的应答性,预示着较好的预后;而Cluster 2则富集于凝血相关通路,预后较差,但对常规化疗和靶向治疗可能更敏感。所构建的预后特征和列线图在预测患者生存和指导个体化治疗方面展现出卓越的性能,且优于多个现有模型。该研究深化了对凝血系统在肺腺癌肿瘤微环境和治疗应答中作用的理解,为肺腺癌的精准预后评估和治疗策略选择提供了新的生物标志物和工具。
研究也指出了几点局限性,例如分析主要基于mRNA水平,需要蛋白水平实验验证;风险评分在特定基因突变亚型(如EGFR或ALK突变)中的预测效能有待进一步研究;IC50分析来源于体外数据,需要临床队列回顾性分析加以验证。未来的研究应着重于探索关键CRGs(如SERPINE1)影响预后的具体分子机制,并在前瞻性临床研究中验证该模型的预测价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号