
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的胆囊腺瘤与胆固醇息肉术前预测模型构建:一项多中心回顾性研究
【字体: 大 中 小 】 时间:2025年02月10日 来源:World Journal of Surgical Oncology 2.4
编辑推荐:
编辑推荐:本研究针对胆囊息肉样病变(GPLs)术前鉴别难题,通过整合临床基线数据、血清学指标和超声影像特征,应用12种机器学习算法构建110种组合预测模型。最佳模型SVM+RF在训练集和内部验证集的AUC分别达0.972和0.922,特征选择包含胆囊壁厚度、息肉大小、回声特征和带蒂情况,为个体化治疗决策提供新工具。
青岛大学附属医院王玉兵团队联合潍坊医学院附属医院等机构,开展了一项多中心回顾性研究。研究者收集了2015-2022年间1582例经病理确诊的病例数据,通过机器学习算法构建预测模型。研究采用KNN填补处理缺失值,应用包括支持向量机(SVM)、随机森林(RF)等12种算法构建110种组合模型,通过5折交叉验证优化超参数。最终模型在包含139例的外部验证集中仍保持0.78的AUC值。
在模型构建方面,研究团队发现SVM+RF组合表现最优,其选择的四个关键特征具有重要临床意义:胆囊壁厚度每增加0.1cm风险提升1.8倍;息肉直径>1.45cm时腺瘤概率显著增高;低回声病变的恶性风险是高回声的3.2倍;带蒂息肉更倾向腺瘤表现。这些发现与既往研究形成互补,如Wang等曾提出1.45cm是鉴别阈值,而Mellnick团队早先注意到腺瘤多呈带蒂低回声。
研究还揭示了三个新颖预测因子:年龄>50岁患者腺瘤发生率提升2.1倍;腺苷脱氨酶(ADA)水平>10U/L组风险增加1.7倍;代谢综合征患者更易发生腺瘤性病变。这些发现拓展了传统认知,特别是ADA与肿瘤血管生成的关系,为发病机制研究提供新线索。
在方法学创新上,该研究首次将机器学习组合算法应用于GPLs鉴别诊断。相比传统统计模型,其优势体现在:通过特征权重分析量化各指标贡献度;校准曲线显示预测概率与实际风险高度吻合;决策曲线证实临床净收益优于现行标准。研究者还将模型部署为在线工具(http://123.56.229.150:1000/),提升临床可及性。
讨论部分指出,该模型有效弥补了现有指南的不足:对6-9mm的"灰色地带"病变提供量化风险评估;避免10mm以上良性病变的不必要手术。但研究者也承认局限性:超声检查的操作者依赖性可能影响结果稳定性;样本量仍需扩大验证。建议未来结合CEUS等新技术特征,探索多模态联合预测。
这项研究为GPLs的精准诊疗带来重要突破:首次建立基于常规超声的机器学习预测体系,临床医生仅需评估四个直观指标即可获得风险评分。不仅避免过度医疗,更实现腺瘤的早期干预,符合肿瘤二级预防策略。研究结果发表于《World Journal of Surgical Oncology》,为胆囊病变管理提供了循证决策工具。
生物通微信公众号
知名企业招聘