基于深度学习的人工智能模型预测口腔鳞状细胞癌患者生存率:一项整合多因素个体化预后的创新研究
《Scientific Reports》:Deep learning–based artificial intelligence models predict survival in patients with oral cavity squamous cell carcinoma
【字体:
大
中
小
】
时间:2025年12月11日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对传统TNM分期在口腔鳞状细胞癌(OSCC)预后预测中个体化不足的局限,创新性地应用深度学习神经网络(DNN)整合临床、病理及生活方式等多维度变量构建生存预测模型。结果表明,多分类DNN模型的预测性能显著优于传统方法(C-index达0.888),尤其擅长捕捉复发时间、WPOI(最差侵袭模式)、PET SUVmax等关键非线形关系,为OSCC的个体化治疗决策提供了精准工具。
口腔癌是全球日益严峻的健康问题,其中口腔鳞状细胞癌(Oral Squamous Cell Carcinoma, OSCC)占所有口腔癌的90%以上。尽管诊断技术和治疗策略不断进步,OSCC的发病率仍在持续上升,其高侵袭性和转移能力导致高死亡率和高致残率。目前,OSCC的5年生存率约为50%,早期诊断患者的生存率可达84%,而晚期(III、IV期)诊断的患者生存率骤降至39%,凸显了早期诊断和精准预后评估的紧迫性。
传统的OSCC生存预测主要依赖美国癌症联合委员会(AJCC)第8版TNM分期系统,虽然该分期系统提供了合理的预测准确性,但存在明显局限:分期差异会导致预后判断不准确,且TNM分期未能充分纳入影响患者预后的其他重要临床因素,如年龄、性别、吸烟饮酒史、美国麻醉医师协会(ASA)分级、治疗方式、复发模式、肿瘤浸润深度(Depth of Invasion, DOI)、神经周围浸润(Perineural Invasion, PNI)、淋巴血管侵犯(Lympho-Vascular Invasion, LVI)以及正电子发射断层扫描(PET)的最大标准化摄取值(Maximum Standardized Uptake Value, SUVmax)等。这些因素的复杂组合和潜在的非线性相互作用,使得传统的统计模型(如Cox比例风险模型)难以进行精准建模。因此,开发能够整合多维度临床变量、捕捉复杂关系的先进预测工具,对于实现OSCC的个体化预后判断和治疗规划至关重要。
为了解决上述问题,研究人员开展了一项回顾性研究,旨在利用人工智能(Artificial Intelligence, AI)技术,特别是深度学习(Deep Learning)方法,构建一个能够整合多种临床病理因素的OSCC患者生存预测模型。该研究纳入了1996年7月至2020年1月期间在一家三级医院接受根治性手术治疗的1018例OSCC患者。研究团队开发了一种用于多组分类的深度神经网络(Deep Neural Network, DNN)模型,并将其性能与基于回归的DNN模型、Cox比例风险(Cox Proportional Hazards, COX-PH)模型和随机生存森林(Random Survival Forest, RSF)模型进行了比较。为了处理数据中的类别不平衡问题,研究应用了最小二乘法(Least Squares Method, LSM)和多任务学习(Multi-task Learning)策略。模型性能通过一致性指数(Concordance Index, C-index)和线性度测试(Linearity Testing)进行评估。这项创新研究发表于《Scientific Reports》期刊,为OSCC的精准医疗提供了新的思路和工具。
本研究的关键技术方法主要包括:1) 回顾性队列构建:从单中心纳入1018例经手术治疗的OSCC患者,收集其人口统计学、生活方式、ASA分级、TNM分期(依据AJCC第8版)、PET SUVmax、PNI、LVI、结外扩展(Extranodal Extension, ENE)、DOI、切缘状态、治疗方式及复发等变量。2) 数据预处理:对分类变量采用独热编码(One-Hot Encoding),对数值变量进行标准化缩放(Standard Scaler),缺失值用-1标记。3) 特征重要性分析:使用排列重要性(Permutation Importance)评估各变量对模型的贡献度。4) 深度学习模型构建:构建三层DNN,输出层使用SoftMax函数进行多标签分类(分为60个月间隔)。5) 模型训练与验证:采用分层5折交叉验证,80%数据用于训练,20%用于测试,并通过网格搜索优化超参数。6) 性能评估:主要指标包括C-index、微平均曲线下面积(Micro-Average Area Under the Curve, AUC)、敏感性、特异性以及线性度测试(y=ax+b,理想情况a=1, b=0)。
研究队列的平均年龄为60.1±16.1岁,男性占58.5%。肿瘤分期分布为I期37.8%,II期18.4%,III期13.8%,IV期28.2%。平均PET SUVmax为8.7±5.8,平均DOI为6.58±6.51 mm。PNI、LVI和ENE的阳性率分别为16.0%、12.5%和14.5%。治疗方案以单纯手术为主(59.1%),其次为手术联合辅助放疗(23.0%)和手术联合辅助放化疗(17.9%)。中位随访期间,复发率为22.4%(局部复发11.6%,区域复发12.0%,远处转移4.4%),死亡率为18.1%。复发患者的平均复发时间为33.0±23.8个月,死亡患者的平均生存时间为36.8±22.7个月。Kaplan-Meier生存分析显示,不同TNM分期患者的无复发生存(Recurrence-Free Survival, RFS)、总生存(Overall Survival, OS)、疾病特异性生存(Disease-Specific Survival, DSS)、局部区域无复发生存(Locoregional Recurrence-Free Survival)和远处无转移生存(Distant Metastasis-Free Survival)均存在显著差异(p值均<0.001),证实了TNM分期的预后价值,但也提示其不足以完全解释预后的个体差异。
通过特征重要性分析,研究人员识别出影响OSCC患者生存的关键因素。如图所示,最重要的十个因素依次为:复发时间、最差侵袭模式(Worst Pattern of Invasion, WPOI)、饮酒史、PET SUVmax、高龄、T分期、切缘状态、DOI以及吸烟史。其中,复发时间是最具影响力的预测因子(重要性得分:0.162±0.017(统计误差)±0.002(系统误差)),其次是WPOI、饮酒史和PET SUVmax。值得注意的是,饮酒史的影响大于吸烟史,且PET SUVmax作为影像学指标显示出重要的预后价值,而N分期在本研究的模型中并未进入最具影响力的前十因素之列,这可能提示淋巴结转移的细节(如转移淋巴结数目、淋巴结比率)可能是比单纯的N分期更重要的预后指标。
研究人员比较了五种不同模型在预测OSCC患者总生存期方面的性能:多分类DNN、回归DNN、COX-PH、RSF以及仅使用T/N分期的DNN模型。结果表明,仅使用T/N分期的DNN模型预测性能最差(C-index为0.504±0.007)。多分类DNN模型表现最佳,其微平均AUC高达0.922±0.002,敏感性为0.514±0.011,特异性为0.992±0.001,线性度斜率为0.948±0.051,截距为2.820±2.323,C-index为0.888±0.007。回归DNN模型的C-index(0.905±0.007)略高于多分类DNN,但其微平均AUC(0.610±0.009)和线性度指标均较差。传统的COX-PH和RSF模型表现不佳,其C-index分别为0.637±0.022和0.557±0.017,线性度斜率远偏离1(COX-PH: 0.231±0.065; RSF: 0.028±0.083),截距也很大,表明其预测值与观测值之间存在较大偏差。统计比较证实,多分类DNN模型在C-index上显著优于COX-PH和RSF模型(p<0.001)。
通过比较各AI模型估计的生存曲线与Kaplan-Meier验证曲线,可以直观地评估模型的校准能力。如图3和图4所示,多分类DNN模型预测的生存概率曲线与验证曲线最为接近,显示出良好的校准度。而回归DNN、COX-PH和RSF模型的预测曲线与验证曲线之间存在明显差异,特别是在长期生存预测方面。这表明多分类DNN模型不仅具有出色的判别能力(高C-index和AUC),还能准确估计不同时间点的生存概率,这对于临床决策至关重要。
本研究的核心结论是,基于深度学习的人工智能模型,特别是多分类DNN,能够有效整合多维度临床病理变量,显著提升OSCC患者生存预测的准确性,其性能优于传统的TNM分期和统计模型。该模型成功识别出复发时间、WPOI、饮酒史、PET SUVmax等关键预后因素,揭示了这些因素之间复杂的非线性关系。这项研究的重要意义在于:首先,它提供了一种超越传统TNM分期的个体化预后预测工具,有助于临床医生更准确地评估患者风险,制定更合理的治疗和随访策略。其次,该模型具有良好的校准度,其预测的生存曲线与实际情况高度吻合,增强了其在临床实践中的可信度。此外,研究证实了PET SUVmax等影像学指标在OSCC预后预测中的价值,为未来整合多模态数据(如影像组学、基因组学)提供了方向。尽管本研究存在单中心回顾性设计、未纳入肿瘤亚部位和淋巴结负荷细节、缺乏外部验证等局限性,但它清晰地展示了AI在解决复杂临床预测问题上的巨大潜力。未来的研究应致力于纳入更丰富的生物标志物和基因组数据,并在多中心队列中进行外部验证,以进一步推动OSCC的精准医疗发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号