
-
生物通官微
陪你抓住生命科技
跳动的脉搏
开发并验证一个机器学习模型,用于预测乳腺癌患者中度至重度的癌症相关疲劳症状
《Supportive Care in Cancer》:Development and validation of a machine learning model to predict moderate-to-severe cancer-related fatigue in breast cancer
【字体: 大 中 小 】 时间:2025年12月17日 来源:Supportive Care in Cancer 3
编辑推荐:
乳腺癌患者抗肿瘤治疗后两年中重度癌症相关性疲劳(CRF)的机器学习预测模型研究。通过回顾性分析183例患者临床实验室数据,筛选出年龄、BMI、病理分级等8个独立预测因子,构建逻辑回归、随机森林等7种算法模型。XGBoost模型表现最优,训练集AUC 0.983,测试集AUC 0.766,校准曲线显示预测与实际风险一致,决策曲线分析证实临床净获益显著。
本研究旨在建立并验证一个机器学习模型,用于预测乳腺癌患者在完成抗肿瘤治疗2年后出现中度至重度癌症相关疲劳(CRF)的情况。
回顾性收集了183名患者的临床和实验室数据。使用多元逻辑回归筛选出潜在的预测因子,并在训练队列中构建了七种算法——逻辑回归、决策树、随机森林、支持向量机、极端梯度提升(XGBoost)、k近邻和朴素贝叶斯——然后在测试队列中进行验证。通过判别能力、校准和决策曲线分析来评估模型性能。
2年内出现中度至重度CRF的发病率为54.0%。确定了8个独立的预测因子,包括年龄、体重指数、组织学分级、绝经状态、血红蛋白、血小板计数、中性粒细胞计数和系统性免疫炎症指数。基于这些特征构建的模型表现出不同的性能,其中XGBoost的表现最为优异。其在训练集上的AUC为0.983,在验证集上的AUC为0.766,具有较高的准确性、敏感性和特异性。校准图显示预测风险与实际风险之间有良好的一致性,而决策曲线分析证实了在广泛的阈值范围内具有较高的净临床效益。
基于XGBoost的模型提供了可靠的长期CRF风险预测,有助于早期识别高风险患者,并为个性化生存期护理提供依据。
本研究旨在建立并验证一个机器学习模型,用于预测乳腺癌患者在完成抗肿瘤治疗2年后出现中度至重度癌症相关疲劳(CRF)的情况。
回顾性收集了183名患者的临床和实验室数据。使用多元逻辑回归筛选出潜在的预测因子,并在训练队列中构建了七种算法——逻辑回归、决策树、随机森林、支持向量机、极端梯度提升(XGBoost)、k近邻和朴素贝叶斯——然后在测试队列中进行验证。通过判别能力、校准和决策曲线分析来评估模型性能。
2年内出现中度至重度CRF的发病率为54.0%。确定了8个独立的预测因子,包括年龄、体重指数、组织学分级、绝经状态、血红蛋白、血小板计数、中性粒细胞计数和系统性免疫炎症指数。基于这些特征构建的模型表现出不同的性能,其中XGBoost的表现最为优异。其在训练集上的AUC为0.983,在验证集上的AUC为0.766,具有较高的准确性、敏感性和特异性。校准图显示预测风险与实际风险之间有良好的一致性,而决策曲线分析证实了在广泛的阈值范围内具有较高的净临床效益。
基于XGBoost的模型提供了可靠的长期CRF风险预测,有助于早期识别高风险患者,并为个性化生存期护理提供依据。
生物通微信公众号
知名企业招聘