编辑推荐:
研究针对脓毒症识别难题,开展无监督聚类研究,发现该方法有潜力,为脓毒症诊疗提供新方向。
脓毒症,这个在全球健康领域兴风作浪的 “狠角色”,每年约影响 4900 万人,还导致全球 20% 的死亡案例。它就像一个难以捉摸的 “幽灵”,缺乏明确的诊断金标准,临床医生在床边识别时常常感到棘手,不同的识别算法得出的发病率也大相径庭。目前常用的基于医院行政数据编码和电子健康记录(EHR)的算法,如成人脓毒症事件(ASE)标准,都存在一定的局限性,很可能低估了脓毒症的实际负担。
在这样的背景下,来自加拿大多个医学中心的研究人员决心 “驯服” 脓毒症这头 “猛兽”,他们开展了一项具有创新性的研究。该研究成果发表在《Intensive Care Medicine Experimental》上。
为了实现这一目标,研究人员采用了一系列关键技术方法。他们进行了回顾性队列研究,收集了加拿大卡尔加里健康地区 2015 年 4 月至 2017 年 3 月间成人重症监护病房(ICU)患者的住院数据,这些数据来源广泛,包括多个行政和电子数据系统 。研究人员对 592 个变量进行了预处理,涵盖患者的人口统计学信息、诊疗特征、诊断、用药、实验室检查等方面。之后,通过 Kaiser–Meyer–Olkin 检验(KMO)和主成分分析(PCA)进行变量筛选和降维,最终得到 55 个主成分 。接着,他们评估了 8 种无监督聚类算法,利用自动肘部法确定最佳聚类数,并通过多种内部聚类指标来比较算法的性能,还运用了子采样稳定性估计方法评估聚类稳定性 。最后,使用 XGBoost 模型进行聚类标签预测和外部验证。
下面来看看具体的研究结果:
- 聚类方法:开发队列和验证队列分别包含 3660 和 3012 名独特的 ICU 患者,二者特征相似。经过一系列筛选,55 个主成分用于后续建模 。在 8 种聚类算法中,K-means 和鲁棒稀疏 K 均值聚类(RSKC)在内部评估指标中排名靠前,而 RSKC 的子采样稳定性更优,因此被用于后续分析。
- 聚类分析:在开发队列中,21.5% 的患者为 ASE 阳性。11 个 ASE 多数簇包含了 821 名患者,其中 612 名(74.5%)为 ASE 阳性,占队列中所有 ASE 阳性患者的 77.8%;而 37 个 ASE 少数簇中的 2839 名患者,仅有 175 名(6.2%)为 ASE 阳性 。通过对 ASE 多数簇的分析发现,许多 ASE 阴性患者与阳性患者在大多数参数上相似,放宽 ASE 标准后,34.9% 的 ASE 阴性患者可被重新归类为脓毒症。此外,临床评估将 48 个簇分为 8 个类别,多数与脓毒症或感染相关的簇为 ASE 多数簇 。在验证队列中,结果与开发队列相似,进一步验证了研究的可靠性。
研究结论和讨论部分指出,该研究首次将无监督机器学习聚类算法应用于脓毒症识别,RSKC 算法表现出最佳的聚类性能。通过对聚类结果的分析发现,许多脓毒症病例,尤其是较轻的病例,可能被当前基于阈值的识别算法遗漏。这种新方法不依赖于预先定义的标准,能够发现更广泛临床谱上的脓毒症亚表型,为脓毒症的识别和理解提供了新的方向。尽管该研究还处于初步阶段,存在一定的局限性,如仅在单一地区的 ICU 队列中进行研究,数据质量和完整性存在一定问题,且未评估所有聚类算法,但这些早期发现依然令人鼓舞。未来,研究人员计划进一步扩展和优化输入变量,对聚类结果进行专家标注,将该方法应用于不同地区和人群,并结合联邦学习方法进行更广泛的研究,有望为脓毒症的诊疗带来革命性的变化。