开发并验证一个机器学习模型,用于预测乳腺癌患者中度至重度的癌症相关疲劳症状

《Supportive Care in Cancer》:Development and validation of a machine learning model to predict moderate-to-severe cancer-related fatigue in breast cancer

【字体: 时间:2025年12月17日 来源:Supportive Care in Cancer 3

编辑推荐:

  乳腺癌患者抗肿瘤治疗后两年中重度癌症相关性疲劳(CRF)的机器学习预测模型研究。通过回顾性分析183例患者临床实验室数据,筛选出年龄、BMI、病理分级等8个独立预测因子,构建逻辑回归、随机森林等7种算法模型。XGBoost模型表现最优,训练集AUC 0.983,测试集AUC 0.766,校准曲线显示预测与实际风险一致,决策曲线分析证实临床净获益显著。

  

摘要

目的

本研究旨在建立并验证一个机器学习模型,用于预测乳腺癌患者在完成抗肿瘤治疗2年后出现中度至重度癌症相关疲劳(CRF)的情况。

方法

回顾性收集了183名患者的临床和实验室数据。使用多元逻辑回归筛选出潜在的预测因子,并在训练队列中构建了七种算法——逻辑回归、决策树、随机森林、支持向量机、极端梯度提升(XGBoost)、k近邻和朴素贝叶斯——然后在测试队列中进行验证。通过判别能力、校准和决策曲线分析来评估模型性能。

结果

2年内出现中度至重度CRF的发病率为54.0%。确定了8个独立的预测因子,包括年龄、体重指数、组织学分级、绝经状态、血红蛋白、血小板计数、中性粒细胞计数和系统性免疫炎症指数。基于这些特征构建的模型表现出不同的性能,其中XGBoost的表现最为优异。其在训练集上的AUC为0.983,在验证集上的AUC为0.766,具有较高的准确性、敏感性和特异性。校准图显示预测风险与实际风险之间有良好的一致性,而决策曲线分析证实了在广泛的阈值范围内具有较高的净临床效益。

结论

基于XGBoost的模型提供了可靠的长期CRF风险预测,有助于早期识别高风险患者,并为个性化生存期护理提供依据。

目的

本研究旨在建立并验证一个机器学习模型,用于预测乳腺癌患者在完成抗肿瘤治疗2年后出现中度至重度癌症相关疲劳(CRF)的情况。

方法

回顾性收集了183名患者的临床和实验室数据。使用多元逻辑回归筛选出潜在的预测因子,并在训练队列中构建了七种算法——逻辑回归、决策树、随机森林、支持向量机、极端梯度提升(XGBoost)、k近邻和朴素贝叶斯——然后在测试队列中进行验证。通过判别能力、校准和决策曲线分析来评估模型性能。

结果

2年内出现中度至重度CRF的发病率为54.0%。确定了8个独立的预测因子,包括年龄、体重指数、组织学分级、绝经状态、血红蛋白、血小板计数、中性粒细胞计数和系统性免疫炎症指数。基于这些特征构建的模型表现出不同的性能,其中XGBoost的表现最为优异。其在训练集上的AUC为0.983,在验证集上的AUC为0.766,具有较高的准确性、敏感性和特异性。校准图显示预测风险与实际风险之间有良好的一致性,而决策曲线分析证实了在广泛的阈值范围内具有较高的净临床效益。

结论

基于XGBoost的模型提供了可靠的长期CRF风险预测,有助于早期识别高风险患者,并为个性化生存期护理提供依据。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号