机器学习能够实现膜翅目昆虫蜇伤风险的早期分层:来自热带多中心队列研究的证据

《Frontiers in Public Health》:Machine learning enables early risk stratification of hymenopteran stings: evidence from a tropical multicenter cohort

【字体: 时间:2025年10月28日 来源:Frontiers in Public Health 3.4

编辑推荐:

  本研究基于海南地区942例 hymenopteran 蜇伤患者的多中心数据,开发了具有高区分度的可解释机器学习模型(AUC=0.982),并部署了简化的在线风险计算器,以早期预测严重并发症,显著优于传统评分系统。

  在热带地区,蜂类、黄蜂和胡蜂的叮咬常常引发严重的全身反应,对患者的安全和紧急医疗救治效率构成威胁。为了在患者首次就诊时准确评估其风险等级,从而指导及时干预,研究人员开发了一种可解释的机器学习模型,用于预测严重后果的发生。该研究在海南省的多个医疗中心回顾性分析了942例病例,其中8.7%的患者出现了严重的全身并发症。研究中使用的模型在验证集上表现优异,取得了高达0.982的AUC值、0.956的召回率和0.926的精确率。模型的关键预测变量包括低血压、呼吸困难、意识状态改变、白细胞计数升高以及肌酐水平异常。此外,研究人员还部署了一个基于网络的风险计算器,以便在床边快速应用。

在临床实践中,及时识别高危患者是确保患者安全和提高医疗效率的重要环节。近年来,随着人工智能技术的发展,越来越多的研究开始探索其在急诊医学中的应用。然而,大多数现有的风险评估方法仍依赖于经验判断,难以满足紧急情况下的快速决策需求。本研究的模型不仅具备良好的预测性能,还通过SHAP(Shapley Additive exPlanations)提供了可解释性,使医生能够理解模型的预测逻辑,从而增强对AI辅助决策的信任。这种透明度对于临床应用和监管合规至关重要。

模型的构建过程涉及多个步骤,包括数据预处理、特征选择和分类器训练。研究人员首先对数据进行了处理,排除了超过20%数据缺失的问卷,并采用均值替代法进行初步数据填补。为了提高模型的稳健性和预测能力,他们进一步使用了多重插补法(MICE)进行敏感性分析,发现MICE填补的数据集在性能和稳定性方面优于均值替代法。在模型训练过程中,采用了五折交叉验证,以防止过拟合,并使用ADASYN算法处理类别不平衡问题,该算法通过生成合成样本,提高了对罕见事件的识别能力。

在特征选择方面,研究团队利用递归特征消除(RFE)和XGBoost模型的特征重要性分析,筛选出对模型预测影响最大的五个变量:低血压、GCS评分低于15、基础疾病、呼吸困难和全身性荨麻疹。这些变量在临床中易于获取,非常适合用于急诊环境下的快速评估。此外,通过SHAP分析,研究人员还发现白细胞计数和肌酐水平对模型预测具有显著贡献,而其他变量如皮疹和晕厥的影响相对较小。这种特征选择策略不仅提高了模型的实用性,还确保了其在实际应用中的高效性。

在模型性能方面,研究团队比较了多种分类器,包括XGBoost、Extra Trees、CatBoost等,最终选择Extra Trees作为主要模型。该模型在测试集上表现出色,其AUC值达到0.959,召回率和精确率分别为0.919和0.866。同时,他们还构建了一个简化版的XGBoost模型,仅使用五个关键特征,该模型在AUC值上略低于完整特征模型,但保留了较高的预测能力,且在临床实践中更具可操作性。模型的部署方式为一个在线风险评估工具,允许医生在患者入院时输入相关临床指标,并实时获得高危概率的预测结果。

模型的实际应用案例表明,对于一名38岁的男性患者,其在被胡蜂叮咬10小时后入院,出现低血压、呼吸困难、白细胞计数升高和肌酐异常,模型预测其高危概率为94.3%,最终将其归类为高风险患者。相比之下,一名58岁的女性患者,尽管有高血压病史,但未出现意识障碍、低血压或呼吸困难,其高危概率仅为31.7%,被归为低风险患者。这些案例说明,该模型能够根据患者的具体情况提供个性化的风险评估,有助于医生制定更有针对性的干预措施。

在临床应用方面,该模型为急诊医生提供了一种新的工具,用于快速识别高危患者并优化资源分配。传统风险评分系统如SOFA、qSOFA和NEWS虽然在某些领域已被广泛应用,但它们通常基于固定的阈值和有限的临床参数,难以全面反映蜂类叮咬后的复杂病理生理过程。相比之下,机器学习模型能够捕捉更多变量之间的非线性关系,从而提高预测的准确性。此外,该模型的可解释性使其更易于被临床医生接受,并在实际工作中发挥更大的作用。

然而,研究也指出了一些局限性。首先,数据来源于海南省的五个医疗中心,虽然具有区域代表性,但其地理和人口多样性仍然有限。其次,研究缺乏关于蜂种、毒液剂量和治疗延迟的具体信息,这限制了对剂量-反应关系的深入分析。最后,尽管模型在内部测试数据上表现稳定,仍需要在其他地区和前瞻性研究中进行外部验证,以确保其在不同人群中的适用性。

总体而言,这项研究为蜂类叮咬后的风险评估提供了一个新的方法,不仅提高了预测的准确性,还增强了模型的可解释性,使其更适用于临床实践。未来的研究应进一步探索模型在不同地理区域和人群中的表现,并通过优化特征工程和模型架构,提高其在实际应用中的稳定性和可靠性。同时,研究人员也强调,尽管AI在医疗决策中具有巨大潜力,但医生的专业判断仍然是不可替代的,特别是在数据缺失或模型置信度较低的情况下,应结合临床经验进行综合评估。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号