
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习和DeepSeek-R1的胆囊癌术前T分期鉴别:血液标志物与放射学文本分析的对比研究
【字体: 大 中 小 】 时间:2025年08月04日 来源:Frontiers in Oncology 3.3
编辑推荐:
这篇研究通过对比机器学习(ML)模型与大型语言模型(DeepSeek-R1)在胆囊癌(GBC)术前T分期中的表现,揭示了血液标志物(如NLR、CEA、CA19-9)的局限性(AUC<0.60),而放射学文本分析凭借自然语言处理技术实现了89.6%的高准确率,为临床决策提供了新思路。
背景
胆囊癌(GBC)作为胆道系统最常见的恶性肿瘤,早期症状隐匿且易与良性病变混淆,导致诊断延迟。手术是唯一可能治愈的手段,但手术范围高度依赖术前T分期的准确性,尤其是区分T1(肿瘤局限于黏膜或肌层)和T2(侵犯周围结缔组织)的关键性。传统影像学诊断受限于主观描述,而血液标志物(如CA19-9、NLR)的独立预测价值尚不明确。
方法
研究回顾性纳入232例病理确诊的GBC患者(T1=51,T2=181),评估两种AI策略:
机器学习模型:基于7项血液标志物(NLR、MLR、PLR、CEA、CA19-9、CA125、AFP),训练随机森林(Random Forest)、XGBoost等算法,并测试合成少数类过采样技术(SMOTE)的效果。
大型语言模型(DeepSeek-R1):通过零样本提示和思维链(CoT)示例,解析放射学报告文本(如“胆囊壁增厚”),结合或不结合血液标志物数据。
结果
血液标志物模型表现不佳:最佳模型XGBoost的测试集AUC仅0.508,SMOTE虽提升交叉验证准确率(如XGBoost从71%至80%),但未改善独立测试性能(AUC降至0.473)。SHAP分析显示PLR和MLR贡献度最高,但整体区分力不足。
DeepSeek-R1显著优势:零样本提示下,T分期准确率达89.6%,N/M分期100%准确。模型从文本中捕捉关键线索(如“无淋巴结肿大”对应N0),而添加血液标志物未提升性能。
讨论
研究揭示了血液标志物在早期GBC分期的局限性,而放射学文本的语义信息被LLM高效挖掘。DeepSeek-R1的推理过程模拟临床思维,例如将“胆囊壁增厚”关联至T2分期,但其性能依赖报告质量。未来需多中心验证,并探索多模态(影像+文本+标志物)融合模型。
局限性
单中心回顾性设计、样本不平衡(T1仅22%)、未整合原始影像数据是主要局限。此外,LLM的提示工程(如CoT示例意外降低准确率)需进一步优化。
结论
血液标志物未能有效区分早期GBC T分期,而基于放射学文本的LLM展现出临床实用潜力,为术前决策提供了高精度、可解释的辅助工具。
生物通微信公众号
知名企业招聘