基于常规血液代谢指标联合逻辑回归与随机森林模型的菌血症早期预测研究

【字体: 时间:2025年07月29日 来源:Frontiers in Cellular and Infection Microbiology 4.8

编辑推荐:

  本研究创新性地整合常规血液学指标(CRP、PCT)与代谢标志物(胆固醇、甘油三酯),通过逻辑回归和随机森林模型构建菌血症预测工具。结果显示随机森林模型敏感性(recall=0.69)优于逻辑回归(AUC=0.75 vs 0.74),血小板计数(OR=1.003)、降钙素原(PCT, OR=1.032)及血脂异常成为独立预测因子,为临床早期筛查提供经济高效的解决方案。

  

背景
菌血症作为病原微生物侵入血流引发的全身感染,进展为脓毒症后死亡率高达30-50%。尽管血培养仍是金标准,但其24-72小时的检测周期及抗生素使用后的敏感性下降制约了早期干预。近年来,白细胞计数、中性粒细胞-淋巴细胞比值(NLR)等常规指标因检测便捷性受到关注,但单一参数预测效能有限。本研究探索33项血液代谢指标的组合预测价值,并比较两种机器学习算法的性能差异。

材料与方法
福建中医药大学附属福鼎医院2024年3-8月收治的287例血培养患者被纳入研究,分为菌血症组(n=137)和非菌血症组(n=150)。检测参数包括:

  • 血液学指标:血红蛋白(Hb)、血小板(PLT)、平均血小板体积(MPV)
  • 炎症标志物:C反应蛋白(CRP)、降钙素原(PCT)
  • 代谢指标:血糖(Glu)、总胆固醇(TC)、甘油三酯(TG)
  • 营养指标:白蛋白(Alb)

采用Sysmex XN-9000血液分析仪和Beckman AU5800生化分析仪完成检测。通过70:30比例划分训练集与测试集,分别构建L2正则化逻辑回归模型和经过网格搜索优化的随机森林模型(200棵决策树,最大深度20)。

结果
菌血症组呈现显著特征:

  • 降低指标:Hb(108 vs 121 g/L)、TC(3.4 vs 4.1 mmol/L)、Alb(32 vs 36 g/L)
  • 升高指标:PLT(215×109/L vs 186×109/L)、CRP(28.5 vs 12.4 mg/L)、PCT(0.202 vs 0.085 ng/mL)

多因素分析揭示独立预测因子:

  1. PLT每增加1×109/L,风险提升0.3%(OR=1.003)
  2. PCT每升高1单位,风险增加3.2%(OR=1.032)
  3. 高TG患者风险增加74%(OR=1.740)
  4. 低胆固醇患者风险降低47.7%(OR=0.523)

模型比较显示:

  • 随机森林:AUC 0.75,召回率0.69
  • 逻辑回归:AUC 0.74,召回率0.60
    混淆矩阵揭示随机森林多识别出4例真阳性(TP=29 vs 25),但增加1例假阳性(FP=11 vs 10)。

讨论
血小板增多反映感染相关的炎症反应和凝血激活,与既往研究认为反应性血小板增多预示不良预后的结论一致。PCT虽中位数仅0.202ng/mL,但其连续变量仍具预测价值,提示阈值设定应结合其他指标。血脂异常机制涉及IL-6/TNF-α抑制脂蛋白脂肪酶活性,同时促进肝脏脂质合成,这一病理生理过程为模型提供了生物学合理性。

随机森林展现的敏感性优势使其适合临床筛查场景,而逻辑回归的系数可解释性(如PLT的OR=1.003)更利于风险沟通。相比需要复杂临床评分的qSOFA等工具,本模型仅需常规检验数据,在资源有限地区更具实操性。

展望与局限
单中心回顾性设计和样本量限制影响了模型稳定性。未来应通过多中心前瞻性研究验证,并整合生命体征数据提升预测效能。值得注意的是,菌血症组糖尿病患病率更高(32.1% vs 20.7%),提示代谢紊乱与感染风险的潜在关联值得深入探讨。

结论
整合常规检验指标的机器学习模型为菌血症早期识别提供了新思路,其中随机森林算法在敏感性方面略胜一筹。该策略特别适合检验资源丰富但临床评分实施困难的医疗场景,为抗生素合理使用决策提供辅助依据。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号