编辑推荐:
为优化手术策略,研究人员开展预测肺腺癌 STAS 的机器学习模型研究,XGBoost 模型表现最佳,可指导临床决策。
肺癌是全球癌症相关死亡的主要原因,非小细胞肺癌(NSCLC)占比约 85%。尽管在筛查和治疗方面取得了进展,但肺癌患者的预后仍然不佳,尤其是晚期患者。气腔内播散(Spread through air spaces,STAS)是近年来发现的一个对肺癌侵袭性和预后有重要影响的病理特征,它指的是肿瘤细胞在肺泡腔内扩散,超出了主肿瘤的范围。STAS 的存在与肺癌的高复发率和低生存率密切相关,特别是在早期肺腺癌中,它是一个独立的不良预后因素。目前,STAS 通常只能在术后通过病理检查才能发现,这使得它在术前决策中的作用受到很大限制。因此,术前识别 STAS 对于优化手术策略、改善患者预后至关重要。
山东大学齐鲁医院和山东省千佛山医院的研究人员开展了一项多中心回顾性研究,旨在开发并验证基于术前临床、放射学和病理数据的机器学习模型,以预测肺癌患者 STAS 的存在。该研究成果发表在《BMC Cancer》杂志上。
研究人员为开展此项研究,采用了以下关键技术方法:首先,从山东大学齐鲁医院选取 1174 例肿瘤直径小于 2cm 的肺腺癌患者作为训练和内部验证队列,从山东省千佛山医院选取 116 例符合相同标准的患者作为外部验证队列。然后,收集患者的多种数据,包括人口统计学数据、术前肺功能测试结果、实验室检查结果、术前 CT 数据、肿瘤位置和快速冰冻病理结果等。接着,使用最小绝对收缩和选择算子(LASSO)回归进行特征选择,确定了 13 个关键变量,并构建了 8 种机器学习模型,包括决策树(DT)、随机森林(RF)、正则化支持向量机(RSVM)、逻辑回归(LR)、极端梯度提升(XGBoost)、多层感知器(MLP)、轻量级梯度提升机(LightGBM)和 K 近邻(KNN)。最后,通过受试者工作特征曲线(ROC)、曲线下面积(AUC)、校准曲线、决策曲线分析(DCA)和 SHapley 加性解释(SHAP)图等对模型性能进行评估。
研究结果如下:
- 基线特征:三个队列(训练队列、内部验证队列和外部验证队列)患者的平均年龄均为 59 岁,不同队列间除了部分指标(如结节位置、BMI、单核细胞计数、结节大小等)存在差异外,其他变量差异均无统计学意义。
- 风险因素选择和模型构建:通过 LASSO 回归确定了 13 个独立风险因素,包括癌胚抗原(CEA)、淋巴细胞计数、一秒用力呼气量(FEV1)等。基于这些因素构建的 8 种机器学习模型中,XGBoost 和 LightGBM 算法获得了最高的 AUC 值,分别为 0.931(95% CI:0.897–0.964)和 0.926。XGBoost 在特异性方面表现最佳,达到 0.921。校准曲线和 DCA 分析显示,XGBoost、LightGBM 和 RF 模型在预测 STAS 方面具有良好的校准度和较高的临床实用性。
- 特征重要性、模型可解释性和外部验证:在 XGBoost 模型中,影响 STAS 预测的前五个特征为 CEA、FEV1、肿瘤实变比(CTR)、最大自主通气量(MVV)和微浸润性腺癌(MIA)。SHAP 分析进一步证实了这些因素的重要性,并且发现 CEA 水平升高与 STAS 发生的可能性增加相关。外部验证中,XGBoost 模型在千佛山医院的独立数据集上表现出强大的预测性能,AUC 达到 0.904(95% CI:0.835–0.973),DCA 也表明该模型在广泛的决策阈值范围内具有显著的净效益。
研究结论和讨论部分指出,该研究成功开发了一种整合临床、影像和病理数据的机器学习模型,用于术前预测肺癌患者的 STAS。在构建的 8 种模型中,XGBoost 模型性能最佳,具有较高的泛化能力。SHAP 分析确定了 CEA、FEV1、CTR、MVV、CT 衰减值等重要预测因素,这些因素在预测 STAS 中具有重要的临床意义。该研究成果强调了基于机器学习的预测模型在术前识别高风险患者和指导手术决策方面的潜力。将这种结合多种临床变量预测 STAS 阳性的方法纳入临床实践,可为临床医生改善早期干预策略、降低复发率和优化肺癌患者预后提供有价值的参考。然而,该研究也存在一些局限性,如外部验证数据集仅来自一个中心,可能限制模型在不同人群和医疗环境中的泛化能力;未纳入分子或遗传数据,可能影响预测准确性;研究为回顾性设计,可能存在选择偏倚等。未来需要进一步开展多中心前瞻性研究,并纳入更多的分子和遗传信息,以提高模型的预测性能和临床应用价值。