《Clinical and Translational Oncology》:Validation of a cancer population derived AKI machine learning algorithm in a general critical care scenario
编辑推荐:
急性肾损伤(AKI)严重影响患者健康和医疗成本,尤其对癌症患者威胁更大。研究人员用重症监护医学信息库(MIMIC)数据,验证基于癌症患者数据开发的 AKI 机器学习预测算法。结果显示该算法性能良好,为临床应用提供了依据。
急性肾损伤(Acute Kidney Injury,AKI)就像隐藏在人体健康防线中的 “暗箭”,悄无声息地威胁着人们的生命健康。它是肾脏功能突然受损的病症,常常毫无预警地出现。一旦发生,不仅会引发一系列严重并发症,导致患者死亡率大幅上升,还会让住院费用急剧增加。对于癌症患者而言,AKI 更是雪上加霜。他们本就因癌症身体虚弱,AKI 不仅会干扰癌症治疗进程,还可能进一步损害其他器官,让患者的生命面临更大的危机。
传统检测 AKI 的方法,比如英国国家医疗服务体系(NHS)的检测算法,虽然是目前较为准确的手段,但它只能在肌酐水平升高、器官已经受损后才能发现 AKI,就像是 “马后炮”,无法提前预警,难以在损伤发生前采取有效措施。为了改变这一现状,来自英国曼彻斯特 The Christie NHS Foundation Trust 和曼彻斯特大学的研究人员展开了深入研究。他们希望找到一种能够提前预测 AKI 的方法,给临床治疗争取更多时间,降低患者的健康风险和医疗成本。
研究人员此前基于癌症患者数据开发了一种机器学习算法,能够提前 30 天预测 AKI。为了验证这个算法在不同患者群体中的有效性和适用性,他们选择了 MIMIC-IV 数据库中的数据进行研究。MIMIC-IV 数据库包含了贝斯以色列女执事医疗中心重症监护病房患者的大量去标识化数据,这些数据来源广泛、信息丰富,为研究提供了理想的样本。
在研究过程中,研究人员运用了多种技术方法。首先,他们使用的 AKI 风险预测模型是基于 Python 的 scikit-learn 库实现的随机森林模型,该模型是利用 The Christie NHS Foundation Trust 在 2017 年 1 月至 2020 年 5 月期间 48,865 名癌症患者的常规血液检测结果开发而来。其次,数据来源为 MIMIC-IV 数据库,研究人员从其中的 “labevents” 表获取血液检测结果数据,并进行单位转换和相关计算;利用 “mimic_core” 表中的 “patients” 数据计算患者年龄;通过 “kdigo_stages” 表获取 KDIGO 分期数据,还用 “diagnoses_icd” 表中的 ICD9 和 ICD10 代码确定患者的癌症诊断情况。
研究结果令人振奋:
模型性能良好 :将算法应用于 MIMIC 数据时,每次血液检测的受试者工作特征曲线下面积(AUROC)达到了 0.821(95% 置信区间 0.820 - 0.821)。尽管这一数值略低于在 The Christie 测试集上的 0.881(95% 置信区间 0.878 - 0.883),但依然表明该模型在外部测试队列中表现出色。按照相同的风险等级分类,67.3% 的 AKI 事件在发生前 30 天内至少有一次被评为 “中等” 或更高风险等级,86.6% 的患者在至少一次 AKI 发生前也至少有一次收到 “中等” 或更高风险等级的预警。每次血液检测中,“中等” 或更高风险等级对预测患者在 30 天内发生 AKI 的敏感性为 0.431,特异性为 0.935。
与其他模型对比优势明显 :与其他在 MIMIC 上开发和测试的 AKI 模型相比,该模型的预测窗口最长,可达 30 天,且性能与其他模型相当。
癌症诊断对模型影响较小 :研究人员对 28,498 名患者的癌症诊断情况进行分析,发现将这些患者分为癌症诊断后血液检测和无癌症诊断两组,其 AUROC 分别为 0.801(95% 置信区间 0.800 - 0.802)和 0.836(95% 置信区间 0.835 - 0.837),差异较小,进一步证明了模型的稳健性。
模型在不同 AKI 检测标准下表现不同 :当根据 KDIGO 分期评估模型时,AUROC 为 0.752,低于根据 NHS 检测算法检测 AKI 时的 AUROC。这是因为 NHS 算法比 KDIGO 指南能更早检测到 AKI,而模型在预测 KDIGO 定义的 AKI 时存在过度预测的情况。
研究结论和讨论部分指出,这项研究成功地对在癌症患者群体中开发的 AKI 预测模型进行了 “压力测试”,将其应用于重症监护病房的患者队列,结果显示该模型性能良好,与仅在 MIMIC 数据源上开发和测试的模型相当。这表明该模型具有较强的稳健性和可转移性,为其在临床实践中的广泛应用奠定了基础。尽管研究中发现 “总蛋白” 测量数据的缺失是限制模型更广泛应用的因素,但在相对较大的样本量下,模型依然保持了良好的性能,这也增强了研究人员对模型的信心。未来,研究人员计划进一步拓展模型的测试范围,并探索在预测到 AKI 后实施干预策略的可行性,这有望为临床治疗带来新的突破,更好地保障患者的健康。该研究成果发表在《Clinical and Translational Oncology》杂志上,为相关领域的研究提供了重要参考,推动了 AKI 预测和临床决策的发展。
闂傚倷鑳堕幊鎾绘倶濮樿泛绠插ù锝堟閻牓鏌ㄩ悤鍌涘
婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婇柍瑙勫劤娴滈箖鏌i悢鐓庝喊婵℃彃婀遍埀顒冾潐閹稿摜鈧稈鏅濋埀顒勬涧閵堟悂寮崒鐐村€锋い鎺嶇劍閻﹀酣姊虹拠鎻掝劉缂佸甯″畷婵嬪箳濡も偓缁€澶愭煟閺冨倸甯舵潻婵囩節閻㈤潧孝婵炶尙濞€瀹曟垿骞橀幇浣瑰兊閻庤娲栧ú銊╂偩閾忓湱纾介柛灞剧懅椤︼附淇婇锝囩煉鐎规洘娲熼、鏃堝川椤栵絾绁梻浣瑰缁诲倿鎮ч幘婢勭喓鈧綆鍠楅悡娆愮箾閼奸鍤欐鐐达耿閺屾洟宕堕妸銉ユ懙閻庢鍣崜鐔肩嵁瀹ュ鏁婇柣锝呮湰濞堟悂姊绘担钘変汗闁烩剝妫冨畷褰掓惞椤愶絾鐝烽梺绉嗗嫷娈曟い銉ョ墦閺屾盯骞橀懠顒夋М婵炲濯崹鍫曞蓟閺囥垹骞㈡俊銈咃工閸撻亶鏌i姀鈺佺仭濠㈢懓妫楀嵄闁圭増婢橀~鍛存煟濞嗗苯浜惧┑鐐茬湴閸婃洟婀侀梺鎸庣箓濡瑧绮堢€n喗鐓冪憸婊堝礈濮橆厾鈹嶉柧蹇氼潐瀹曟煡鏌涢幇銊︽珖妞も晝鍏橀弻銊モ攽閸℃瑥鈪靛┑鈽嗗灠椤戝寮诲☉銏犵闁瑰鍎愬Λ锟犳⒑鐠囧弶鍞夊┑顔哄€楃划姘舵焼瀹ュ懐顦ㄥ銈嗘尵婵兘顢欓幒妤佲拺閻犲洠鈧櫕鐏侀梺鍛婃煥妤犳悂鍩㈤幘璇茬闁挎棁妫勫▓銉ヮ渻閵堝棛澧紒顔肩焸閸╂盯寮介鐔哄幈濠电偛妫欓崝鏇㈡倶閳哄偆娈介柣鎰级閸犳﹢鏌熼姘毙х€殿噮鍣e畷鎺懳旀担瑙勭彃
10x Genomics闂傚倷绀侀幖顐﹀磹閻熼偊鐔嗘慨妞诲亾妤犵偞鐗犻垾鏂裤€掓刊鐖剈m HD 闂佽瀛╅鏍窗閹烘纾婚柟鍓х帛閻撴洘鎱ㄥΟ鐓庡付闁诲繒濮烽埀顒冾潐濞叉粓宕伴幘鑸殿潟闁圭儤顨呴獮銏℃叏濮楀棗澧┑顔煎暣濮婃椽宕ㄦ繝鍌滅懆濠碘槅鍋呯划宥夊Φ閺冨牆绠瑰ù锝囨嚀娴犮垽姊洪幖鐐插姉闁哄懏绮撻幃楣冩焼瀹ュ棛鍘遍棅顐㈡搐椤戝懏鎱ㄩ埀顒€鈹戦悙瀛樼稇婵☆偅绮撴俊鐢稿箛閺夊灝宓嗛梺缁樶缚閺佹悂鎮℃担铏圭=濞达絽鎲″﹢鐗堜繆閻愯埖顥夐摶鐐烘煕瑜庨〃鍛矆閸℃稒鐓曢柍鈺佸暈缂傛岸鏌嶈閸忔稓鍒掑▎鎾虫瀬鐎广儱顦伴弲鎼佹煥閻曞倹瀚�
濠电姷鏁搁崑娑樜涙惔銊ュ瀭闁兼祴鏅滃畷鏌ユ倵閿濆骸浜為柍缁樻閹鏁愭惔鈥崇缂備椒鑳跺▍澧俰st闂傚倷绶氬ḿ褍螞濡ゅ懏鏅濋柨婵嗘川缁犳柨顭块懜闈涘婵☆偅蓱閵囧嫰骞樼捄杞扮捕缂傚倸绉崇欢姘跺蓟濞戙垹鍐€闁靛ě鍐f嫛婵犵數鍋涢悧濠囧储椤ョSPR缂傚倸鍊烽悞锔剧矙閹烘鍎庢い鏍仜閻掑灚銇勯幒鍡椾壕濡炪倧缂氶崡鎶藉箖瑜斿畷顐﹀Ψ閵堝棗濯伴梻渚€鈧偛鑻晶鏉戔攽閳ユ剚鍤熼柍褜鍓ㄧ紞鍡涘礈濮樿泛姹查柍鍝勬噺閸婂灚绻涢幋鐐垫噧濠殿喖鍟撮弻娑㈠籍閹炬潙顏�
闂傚倷绀侀幉锟犮€冮崱妞曞搫饪伴崨顓炵亰闂婎偄娲︾粙鎺楀吹閸曨垱鐓熼柟閭﹀墻閸ょ喖鏌曢崼鐔稿唉妤犵偞鐗犲鍫曞箣閻樻鍞堕梻浣告啞閻熴儱螞濠靛棭娼栧┑鐘宠壘鎯熼梺闈涱檧缁茬厧霉閻戣姤鐓熼柣妯夸含閸斿秶鎲搁弶鍨殻闁诡喓鍎甸弫鎾绘晸閿燂拷 - 濠电姷鏁搁崕鎴犲緤閽樺鏆︽い鎺戝閻鏌涢埄鍐$細妞も晜鐓¢弻娑㈠焺閸愭儳姣€闂佸湱鍎ら幐楣冦€呴悜钘夌閺夊牆澧界粔鐢告煕鎼淬垹鐏ラ柍钘夘樀楠炴﹢顢涘顐㈩棜婵犵數鍋為崹鍫曞箹閳哄倻顩叉繝濠傚暟閺嗭箓鏌i弮鍥仩缁炬儳銈搁弻娑㈠焺閸愵厼顥濋梺鍛婃⒐鐢繝骞冨Δ鍛嵍妞ゆ挾鍋樺Σ鎰版⒑缂佹ḿ鈯曢柣鐔濆洤绠悗锝庡枛缁犳煡鏌熸导瀛樻锭闁诡喕绶氬娲川婵犲倻顑傛繝鈷€鍕垫疁鐎殿喗濞婇幃銏ゆ偂鎼达綆鍞规俊鐐€栭弻銊╂倶濠靛牏鐜绘繛鎴欏灪閻撴瑩鎮归妸銉Ц闁稿﹤顭烽幃鐑藉閵堝棛鍘卞┑鐐叉閿氶柣蹇嬪劜閵囧嫰顢曢姀鈺佸壎閻庤娲滄繛鈧€殿喕绮欓、鏍敃閿濆懏璇為悗娈垮枟閹倿寮幘缁樻櫢闁跨噦鎷�
婵犵數鍋為崹鍫曞箰閹间緡鏁勯柛顐g贩瑜版帒鐐婃い鎺嗗亾鏉╂繃绻濋悽闈浶㈤悗姘煎櫍閹本鎯旈妸锔惧幘閻庤娲栧ú銈嗙濠婂牊鐓曢柣鎰摠鐏忥箓鏌熼挊澶娾偓濠氬焵椤掑﹦绉甸柛鎾村哺椤㈡棃濡舵径瀣化闂佽澹嬮弲娑欎繆閾忓湱纾奸柕濞у喚鏆梺鐟板槻閹冲酣銈导鏉戠闁靛ě鈧崑鎾寸節濮橆厾鍘搁柣搴秵閸嬪嫭鎱ㄩ崼銉︾厸鐎光偓閳ь剟宕版惔銊ョ厺闁哄啫鐗嗛崡鎶芥煟濡寧鐝慨锝呭閺岋絾鎯旈姀鈶╁闂佸憡姊圭敮鈥崇暦濠靛鍋勯柣鎾冲閵夆晜鐓ラ柣鏇炲€圭€氾拷