机器学习助力急诊尿检:精准预测抗生素敏感性,改写尿路感染治疗格局?

【字体: 时间:2025年02月24日 来源:Heliyon 3.4

编辑推荐:

  为解决尿路感染(UTI)治疗中因尿液培养结果滞后导致抗生素使用不当的问题,梅奥诊所的研究人员开展用机器学习预测尿液培养抗生素敏感性的研究。结果显示 XGBoost 可实现预测,推荐阅读以了解其如何助力优化 UTI 治疗。

  
在医院的急诊科里,尿路感染(UTI)是极为常见的一种细菌感染病症。想象一下,每天有大量患者因疑似尿路感染来到急诊科,医生们却面临着一个棘手的问题:要治疗尿路感染,得知道尿液里的细菌对哪种抗生素敏感才行,可尿液培养结果通常不能很快拿到。没有这个关键信息,医生只能凭经验用药。

这种 “经验疗法” 带来了不少麻烦。在美国,每年光是尿路感染的医院诊断和住院费用就超过 20 亿美元,而且这也是抗生素不合理使用的常见原因之一。不合理使用抗生素的后果很严重,每年有 280 万例抗菌药物耐药感染,3.5 万人因此死亡;要是把艰难梭菌感染也算上,感染病例会增加到 300 万例,死亡人数升至 4.8 万 。国际专业学会虽然发布了尿路感染管理指南,但医生们却常常不按这些建议来。为啥呢?主要是因为在患者初诊时就得开抗生素,可这时尿液培养和药敏结果还没出来呢。

为了解决这个难题,来自美国梅奥诊所(Mayo Clinic)急诊科的约翰森?M?希勒(Johnathan M. Sheele)等人展开了研究。他们的研究成果发表在《Heliyon》期刊上,论文题目是 “Machine learning to predict urine culture antibiotic sensitivities in the emergency department”。这项研究得出的结论是,XGBoost(极端梯度提升算法,一种监督式开源机器学习算法,它使用梯度提升决策树,具有高效、可扩展和速度快的特点)可以仅利用急诊患者就诊时的现有数据,来预测菌尿对抗生素的敏感性。这一成果意义重大,如果在临床就诊时就能有准确的算法预测抗生素敏感性,就能为尿路感染的治疗选择合适的抗生素,进而改善患者的治疗效果。

在这项研究中,研究人员使用了不少关键技术方法。他们利用 XGBoost 算法,对 2017 年 1 月 1 日至 2021 年 12 月 31 日期间梅奥诊所急诊科的 62,963 例患者就诊数据进行分析。这些数据涵盖了社会和病史、患者人口统计学特征、诊断、用药、检查结果等 1303 个变量 。在分析时,将分类输入特征进行独热编码(one - hot encoded),把数据随机分为训练集和测试集,还用合成少数过采样技术(SMOTE)处理类别不平衡问题,最后评估模型的各项性能指标,如准确率、受试者工作特征曲线下面积(AUROC)等。

下面来看看具体的研究结果:

1. 患者基本情况


研究人员一开始找到了 246,712 个可能符合条件的就诊病例,经过一系列筛选,最终确定了 48,069 人的 62,963 例就诊数据纳入研究。这些患者的年龄中位数是 64 岁,3942 名(6.3%)患者年龄小于 18 岁,大部分患者(64.5%)为女性,89.4% 为白人。在这些病例的尿液培养结果中,18,128 例(28.8%)没有微生物生长,26,999 例(42.9%)每毫升尿液中细菌生长达到或超过 10,000 个菌落形成单位(CFU/mL) ,16,703 例(26.5%)每毫升尿液中细菌生长达到或超过 100,000 个 CFU/mL 。还有 12,084 例患者在尿液培养结果出来前就被诊断为尿路感染,且未住院,尿液培养中每毫升细菌数达到或超过 10,000 个 CFU,细菌种类小于 2 种12

2. XGBoost 模型预测结果


  • 包含阴性尿液培养结果的模型:研究人员用 XGBoost 模型预测所有尿液培养对抗生素的敏感性。结果显示,模型预测尿液培养敏感与中级或耐药的 AUROC 值在 70%(阿米卡星)到 90%(利奈唑胺)之间,中位数为 82%。常用治疗尿路感染的抗生素,如呋喃妥因(84%)、复方新诺明(80%)、环丙沙星(85%)、左氧氟沙星(85%)、第一代头孢菌素(84%)和第三代头孢菌素(80%),都有对应的 AUROC 值 。这表明在包含阴性尿液培养结果(将阴性尿液培养视为对抗生素敏感)的情况下,模型对不同抗生素敏感性的预测有一定准确性。
  • 排除无细菌生长尿液培养结果的模型:当模型排除那些没有报告细菌属或种(也就是没有细菌生长)的尿液培养结果后,AUROC 值范围变为 66%(氨苄西林)到 87%(阿米卡星),中位数为 74%。常见治疗尿路感染的抗生素,如呋喃妥因(69%)、复方新诺明(68%)、环丙沙星(71%)、左氧氟沙星(70%)、第一代头孢菌素(74%)和第三代头孢菌素(77%)的 AUROC 值也相应发生变化。这说明排除这类尿液培养结果后,模型预测的准确性有所下降3
  • 仅包含确诊尿路感染且菌尿患者的模型:当模型只纳入那些在尿液培养结果出来前就被诊断为复杂性或非复杂性尿路感染,且每毫升尿液中细菌数达到或超过 10,000 个 CFU 的患者时,AUROC 值范围是 63%(氨苄西林)到 85%(四环素),中位数为 74% 。常见抗生素的预测准确性也有相应数值,如呋喃妥因(69%)、复方新诺明(67%)等。这表明针对特定患者群体,模型的预测能力也有一定范围4

综合研究结果和讨论部分来看,这项研究意义非凡。XGBoost 算法仅依靠急诊患者就诊时的数据,就能预测菌尿对抗生素的敏感性。不过目前也存在一些局限,比如研究只针对急诊科患者,没有涵盖住院患者和门诊患者,可能无法反映算法在更广泛人群中的表现;模型使用了大量变量,还需要进一步研究哪些变量对预测结果影响更大;而且研究人群存在年龄、种族等方面的局限性,也没有考虑患者的一些个体因素,像肝肾疾病、药物过敏等 。但这依然是朝着精准治疗尿路感染迈出的重要一步,如果后续研究能解决这些问题,将算法融入电子健康记录中,就有可能减少针对耐药或中介细菌的尿路感染的抗生素不合理处方,提高患者的治疗效果,让临床治疗更加科学、合理。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号