
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的宫颈高级别鳞状上皮内病变电圈切除术中微浸润癌风险预测模型构建与验证
【字体: 大 中 小 】 时间:2025年09月08日 来源:Risk Management and Healthcare Policy 2
编辑推荐:
本研究创新性地整合四种特征选择方法(随机森林、Lasso回归、Boruta算法和XGBoost),从3066例高级别鳞状上皮内病变(HSIL)患者中筛选出手术切缘状态、宫颈管搔刮(ECC)、薄层液基细胞学(TCT)≥HSIL等6项关键预测因子,构建可解释的机器学习模型(AUC达0.822)。通过SHAP可视化技术和网页应用部署,为临床制定个体化宫颈微浸润癌(MIC)诊疗策略提供智能决策支持。
Abstract
研究团队通过多中心回顾性研究,系统评估了宫颈高级别鳞状上皮内病变(HSIL)患者接受电圈切除术(LEEP)后进展为微浸润癌(MIC)的风险预测模型。来自两家医院的3066例患者数据被划分为训练集(n=2084)、内部验证集(n=579)和外部测试集(n=403),采用四种机器学习算法筛选出手术切缘状态、宫颈管搔刮(ECC)、TCT≥HSIL、HPV16/18感染、转化区(TZ)III型和年龄等6项核心预测指标。
Methods
研究采用创新的多方法交叉验证策略:随机森林(RF)通过基尼系数降序排列特征重要性,Lasso回归利用L1正则化压缩无关变量系数至零,Boruta算法通过400次迭代对比"影子特征"筛选真实关联变量,XGBoost则基于梯度提升树评估特征贡献度。最终确定的6个预测因子方差膨胀因子(VIF)均<5,Spearman相关性分析显示变量间仅存在低至中度关联(|ρ|<0.34)。
Results
XGBoost模型在训练集和验证集分别达到0.822(95% CI: 0.793–0.852)和0.802(95% CI: 0.730–0.874)的AUC值,敏感性显著优于逻辑回归(0.778 vs 0.682)。SHAP分析揭示手术切缘阳性(平均SHAP值0.56)和ECC阳性(0.55)是驱动MIC预测的最强因素,而年龄(0.09)贡献度相对较低。典型病例分析显示,同时具备切缘阳性和ECC阳性的患者预测MIC概率达83%,显著高于基线风险(18%)。
Discussion
该研究突破传统逻辑回归的线性假设局限,首次将可解释机器学习技术应用于HSIL癌变风险预测。模型捕捉到三个关键临床规律:① 切缘阳性与ECC阳性存在协同效应(ρ=0.23),共同提示病灶残留风险;② TZ III型与年龄正相关(ρ=0.34),反映老年患者鳞柱交界内移的解剖学特征;③ HPV16/18感染通过维持病毒致癌蛋白表达,促进HSIL向MIC转化。
Conclusion
研究团队将模型部署为开源网页应用(https://microinvasion.streamlit.app/),临床医生输入6项常规检查指标即可实时获取个性化风险预测。该工具特别有助于年轻患者生育功能保留决策——对于预测低风险者可采用保守治疗,而高风险者建议扩大切除范围,从而在保证疗效的同时降低重复手术率(当前研究队列中MIC检出率为9.75%)。未来需通过前瞻性研究验证模型在真实世界的临床效用。
生物通微信公众号
知名企业招聘