编辑推荐:
为解决脓毒症实时预测模型(SRPMs)临床应用受限、缺乏全面评估的问题,研究人员开展了对 SRPMs 验证方法和性能的系统回顾研究。结果显示现有模型存在诸多局限,手工特征可提升性能。这为模型发展和临床应用提供了重要依据。
脓毒症,这一在医疗领域令人谈之色变的病症,如同隐藏在暗处的 “杀手”,悄无声息地威胁着患者的生命健康。它起病急、发展快,病情复杂多变,给临床诊断和治疗带来了巨大挑战。早期准确预测脓毒症的发生,对于及时干预、改善患者预后至关重要。然而目前,脓毒症实时预测模型(Sepsis real-time prediction models,SRPMs)虽有潜力成为临床 “利器”,却面临着重重困境。一方面,其验证方法参差不齐,存在潜在偏倚,导致模型性能评估不准确;另一方面,单一的评估指标难以全面反映模型的真实效果,使得这些模型在临床实际应用中推广受限,无法充分发挥其应有的价值。在这样的背景下,为了打破僵局,推动脓毒症预测技术的发展,四川大学华西医院等研究机构的研究人员开展了一项关于脓毒症实时预测模型验证和性能的系统性回顾研究,相关成果发表在《npj Digital Medicine》杂志上。
研究人员采用了多种关键技术方法。首先,在文献检索方面,全面搜索了 PubMed、Web of Science、Embase 和 IEEE Xplore 等多个数据库,确保研究数据的全面性和代表性。其次,运用预测模型偏倚风险评估工具(PROBAST)对纳入研究进行偏倚风险评估,保障研究结果的可靠性。此外,通过提取研究特征、验证方法、模型性能等多方面数据,并进行描述性分析、一致性评估以及单变量和多变量分析,深入探究影响模型性能的因素。
研究结果主要从以下几个方面展开:
- 研究筛选与特征:经过层层筛选,最终纳入 91 项研究。这些研究在 2017 - 2023 年发表,多数来自 PhysioNet/CinC Challenge,且多为多中心研究,主要使用美国公共数据库数据,样本量各异。
- 偏倚风险评估:在参与者、预测因子、结果和分析等领域进行偏倚评估发现,多数研究在参与者和分析领域存在高偏倚风险,部分在预测因子和结果领域也有较高风险或不确定性。
- 验证方法:在验证数据集选择上,多数研究进行了内部验证,部分进行了外部验证,但前瞻性外部验证较少。在全 / 部分窗口验证和指标选择方面,仅 54.9% 的研究采用全窗口框架并计算模型和结果层面的指标。
- 模型性能:部分窗口性能方面,内部验证的性能随预测窗口远离脓毒症发作时间而下降,外部验证的性能在特定时间内相对稳定。全窗口性能方面,内部和外部验证的受试者工作特征曲线下面积(AUROC)无显著差异,但效用评分(Utility Score)在外部验证中显著下降,表明外部验证时假阳性和漏诊增加。联合指标性能显示,仅 18.7% 的研究中 SRPMs 在联合指标评估下表现较好。
- 方法学因素影响:单变量和多变量分析表明,手工特征对模型效用评分有显著正向影响,其中医学指标(Medical Index)和反映特征窗口趋势的特征(Change/Trend in Period)表现突出,医学指标的效用评分相对最高。
研究结论和讨论部分指出,当前 SRPMs 验证存在诸多问题,如全窗口验证且同时使用模型和结果层面指标的研究较少,模型多依赖同质数据集,前瞻性验证不足等。这些问题导致模型性能被高估,影响临床应用。而手工特征对提升 SRPMs 性能具有重要潜力,为模型改进提供了方向。该研究首次系统梳理了 SRPMs 的验证方法,全面总结了不同方法下的模型性能,为后续研究提供了清晰、准确的参考。同时,明确了医学指标等手工特征的重要性,为模型设计提供了新的思路。未来研究应注重多中心数据集的构建、手工特征的应用、多指标全窗口验证以及前瞻性试验,以推动 SRPMs 在临床实践中的广泛应用,为脓毒症的早期预测和治疗带来新的希望,切实改善患者的预后状况,在生命健康领域具有重要的理论和实践意义。