-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习与贝叶斯学习模型提升乳腺癌化疗患者导管相关血栓的预测与分层
《BMC Cancer》:Enhancing prediction and stratifying risk: machine learning and bayesian-learning models for catheter-related thrombosis in chemotherapy patients
【字体: 大 中 小 】 时间:2025年03月28日 来源:BMC Cancer 3.4
编辑推荐:
编辑推荐:针对现有导管相关血栓(CRT)预测模型精度不足的问题,中国医学科学院肿瘤医院团队通过机器学习(ML)和贝叶斯学习算法,在3337例乳腺癌患者队列中开发出基于血红蛋白(134.63 g/L阈值)、APTT(31.71 s阈值)、总胆固醇(11.19 mmol/L阈值)和PICC置管方式的四因素分层系统,验证组HR达5.63,为临床提供兼具高精度与实用性的风险评估工具。
研究团队采用三大关键技术方法:1) 基于AutoGluon框架的自动化机器学习,整合随机森林(RandomForestEntr/Gini)、极端梯度提升(XGBoost)等8种算法;2) 对3337例训练队列(Cohort 1)应用合成少数类过采样技术(SMOTE)处理数据不平衡问题;3) 通过贝叶斯学习建立高斯分布概率模型,计算血红蛋白、APTT等指标的阈值拐点,最终在1274例独立验证队列(Cohort 2)中完成模型验证。
在"基线特征"部分,研究揭示CRT组患者具有显著更高的血红蛋白水平(123 vs 120 g/L, P<0.001)、更短的APTT(25.4 vs 25.7 s, P=0.026)和更高的总胆固醇(4.87 vs 4.77 mmol/L, P=0.031),这些发现为后续建模提供了生物学基础。"ML模型评估"显示,加权集成学习(WeightedEnsemble)模型表现最优,训练集AUC达0.89,测试集AUC保持0.69,其通过整合CatBoost、XGBoost等基模型的优势,显著提升泛化能力。特征重要性分析则发现血小板计数(0.159)、APTT(0.144)等传统指标与HER2(0.032)、Ki-67(0.014)等新型分子标志物共同影响预测效能。
"贝叶斯学习建模"部分通过概率函数推导出关键阈值:血红蛋白>134.63 g/L时CRT风险骤增(概率函数P(A1|x)=α/(1+α),其中α含x2项),APTT<31.71 s和TC>11.19 mmol/L同样预示高风险。值得注意的是,PICC置管方式使CRT风险较CVC提升39%(9.06% vs 6.50%),这与其机械性血管损伤机制相符。"风险分层验证"证实,具有2-4个危险因素的高危组在验证队列中HR高达5.63(95%CI 3.46-9.21),且生存曲线分离显著(P<0.001)。
该研究的突破性意义体现在三方面:首先,首次将肿瘤分子特征(HER2/ER/PR/Ki-67)纳入CRT预测框架,突破传统模型局限;其次,通过贝叶斯学习精确量化指标阈值(如血红蛋白134.63 g/L),为临床决策提供明确临界值;最后,开发的二元分层系统仅需4个易获取参数即可实现高效风险评估,极大提升临床适用性。研究者特别指出,高血红蛋白(>134.63 g/L)作为新型风险标志的发现,颠覆了既往仅关注贫血的认知,可能与红细胞-血小板相互作用增强有关。这些成果为乳腺癌患者个体化抗凝策略制定提供了循证依据,未来需在更多癌种中验证模型的普适性。
知名企业招聘
今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号