《Scientific Reports》:Interpretable machine learning model for early prediction of disseminated intravascular coagulation in critically ill children
编辑推荐:
为解决危重症儿童弥散性血管内凝血(DIC)早期预测难题,研究人员开展了构建可解释机器学习模型的研究。结果显示,XGB 模型(Alfalfa-PICU-DIC)表现最优,能有效识别高风险患儿,这有助于及时干预,降低 PICU 患者 DIC 负担。
在医学领域,危重症儿童的健康一直是备受关注的焦点。其中,弥散性血管内凝血(Disseminated Intravascular Coagulation,DIC)作为一种可能危及生命的血栓出血性疾病,常常在危重症儿童中悄然出现。DIC 可由感染、创伤、恶性肿瘤等多种因素引发,其发病机制复杂,不仅会导致全身凝血途径激活,形成纤维蛋白凝块,进而引发器官衰竭,还会因血小板和凝血因子的大量消耗,造成临床出血症状 。在儿科重症监护病房(Pediatric Intensive Care Unit,PICU)中,DIC 的发病率不容小觑,泰国的一项研究表明,危重症儿童中 DIC 的患病率高达 24%。而且一旦发病,病情往往进展迅速,死亡率居高不下。及时发现并干预 DIC,对改善危重症儿童的预后至关重要。
目前,国际血栓与止血学会(International Society on Thrombosis and Hemostasis,ISTH)制定的 DIC 诊断标准虽被广泛认可,但存在耗时久的问题,在分秒必争的临床救治中,这一缺陷可能延误最佳治疗时机。此外,不同年龄组的凝血参数存在差异,如何选择合适的实验室检测指标进行准确诊断也存在争议。现有的 DIC 预测模型大多针对成年人群,且传统统计方法的预测能力有限,同时缺乏可解释性,难以让临床医生完全信任并应用于日常诊疗。
为了攻克这些难题,福建医科大学附属福建省妇幼保健院的研究人员展开了深入研究。他们旨在构建一个可解释的机器学习模型,用于早期预测危重症儿童的 DIC 风险。该研究成果发表在《Scientific Reports》上,为临床诊断和治疗提供了新的思路和方法。
研究人员从浙江大学医学院附属儿童医院维护的儿科重症监护(Pediatric Intensive Care,PIC)数据库中获取数据,该数据库涵盖了 2010 年至 2018 年期间大量危重症儿童的丰富信息,包括生命体征、用药记录、实验室结果等。经过严格筛选,最终纳入 6093 例危重症儿童。
在研究过程中,研究人员运用了多种技术方法。首先,进行特征提取,从数据库中提取了 28 个变量,涵盖人口统计学信息、合并症、治疗措施以及反映疾病严重程度的实验室参数等。然后,采用逐步逻辑回归模型进行特征选择,确定最终纳入模型的 16 个变量。接着,运用六种机器学习算法,即逻辑回归(Logistic Regression,LR)、极端梯度提升(Extreme Gradient Boosting,XGB)、随机森林(Random Forest,RF)、支持向量机(Support Vector Machine,SVM)、决策树(Decision Tree,DT)和 k 近邻(k-Nearest Neighbor,KNN)构建预测模型,并通过五折交叉验证评估模型性能。最后,利用 Shapley 加性解释(Shapley Additive Explanations,SHAP)方法对最优模型进行解释。
患者基线特征
研究纳入的 6093 例危重症儿童中,女性 2671 例,男性 3422 例,中位年龄 16.08(4.44 - 55.20)个月。根据是否发生 DIC 分为两组,DIC 组 681 例(11.2%),非 DIC 组 5412 例(89.8%)。与非 DIC 组相比,DIC 组儿童的纤维蛋白原(FIB)、血小板计数(PLT)、钙、钠和氯水平显著降低,而丙氨酸氨基转移酶(ALT)、天冬氨酸转氨酶(AST)、肌酐、血细胞比容、D - 二聚体、国际标准化比值(INR)、部分凝血活酶时间(APTT)、凝血酶原时间(PT)、凝血酶时间(TT)和钾水平升高。此外,DIC 组患儿手术、败血症、肝功能不全、肾功能不全和创伤的发生率更高,且更常使用抗凝药物、含 N - 甲基硫代四唑(NMTT)的抗生素和血管活性药物。
特征选择
通过逐步逻辑回归分析,从最初的 28 个变量中筛选出 16 个变量纳入最终模型,包括 APTT、AST、D - 二聚体、INR、PLT 计数、PT、收缩压、TT、年龄、钙、血管活性药物、非甾体抗炎药(NSAIDs)、抗凝剂、败血症、白血病和肾功能不全。
模型开发性能
六种机器学习模型的预测性能评估结果显示,RF 模型在准确率(0.856)、灵敏度(0.866)、Kappa 值(0.472)、阴性预测值(0.423)和召回率(0.866)方面表现最佳;而 XGB 模型在曲线下面积(AUC,0.908)、特异性(0.859)、阳性预测值(0.978)和精度(0.969)上优于其他模型。决策曲线分析(Decision Curve Analysis,DCA)进一步证实,XGB 模型在 DIC 预测中具有最大的净临床效益。综合评估,XGB 模型表现出更优的临床实用性,研究人员将其命名为 Alfalfa - PICU - DIC。
模型解释
为了深入了解模型的决策机制,研究人员运用 SHAP 分析确定了与危重症儿童 DIC 风险最相关的特征。结果表明,D - 二聚体、INR、PT、TT 和 PLT 计数是 DIC 的主要预测指标。此外,研究还发现 APTT、AST、年龄、使用血管活性药物和 NSAIDs、白血病共存与 DIC 风险呈正相关;而 PLT 计数升高、钙水平增加、收缩压升高和使用抗凝剂与 DIC 风险呈负相关。
个体预测解释
研究人员随机选取了验证队列中的一名 3.6 个月大的男童进行分析。该男童经 XGB 模型预测 DIC 风险为 14.8%。通过力图和瀑布图分析发现,D - 二聚体(4.17mg/L)、钙(0.85mmol/L)和 INR(6.34)是影响预测结果的前三大因素。在 PICU 住院期间,该男童未发生 DIC。
综上所述,本研究构建的 XGB 模型(Alfalfa - PICU - DIC)在早期识别危重症儿童 DIC 高风险方面表现卓越。这一模型能够为临床医生提供更准确的预测信息,有助于及时采取干预措施,降低 PICU 患者 DIC 的负担,改善危重症儿童的预后。不过,该研究也存在一定局限性,如回顾性研究可能存在数据缺失和选择偏倚,单中心研究限制了结果的普适性,且缺乏外部验证等。未来还需要进一步的研究加以完善,但此次研究无疑为危重症儿童 DIC 的早期预测开辟了新的道路,具有重要的临床意义和研究价值。
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》