利用深度学习预测精神分裂症患者长期住院风险:多维度数据助力精准医疗

【字体: 时间:2025年03月06日 来源:Schizophrenia

编辑推荐:

  为预测精神分裂症(SCZ)患者长期住院风险,研究人员开发深度学习模型,其准确性高,为临床提供决策支持。

  精神分裂症,一种让人捉摸不透的慢性精神疾病,就像隐藏在患者大脑中的 “神秘幽灵”,常常悄无声息地干扰着患者的思维、情感和行为。患者会陷入妄想、幻觉的虚幻世界,思维变得混乱无序,生活和社交能力也受到严重影响,这不仅给患者自身带来巨大痛苦,也让整个家庭和社会背负沉重负担。由于患者自杀风险增加,健康状况恶化,他们的平均寿命比普通人缩短了 15 - 20 年。
为了更好地帮助这些患者,住院治疗成为关键手段。然而,随着精神分裂症发病率的上升,患者数量越来越多,如何合理分配医疗资源成了一大难题。在患者入院时,准确判断哪些人可能需要长期住院,哪些人能较快康复出院,这对医疗资源的优化配置至关重要。可传统方法在预测长期住院风险时总是 “力不从心”,要么依赖人工提取数据,效率低且不适合大规模应用;要么受限于特征数量和算法效率,预测准确性差。面对这些困境,上海交通大学医学院附属上海精神卫生中心等机构的研究人员决心开展一项深入研究,试图找到更精准的预测方法,为精神分裂症患者的治疗和管理带来新的希望。这项研究成果发表在《Schizophrenia》杂志上。

研究人员在本次研究中主要采用了以下关键技术方法:首先,利用回顾性队列研究,收集了 2018 - 2022 年上海精神卫生中心(SMHC)出院的精神分裂症患者的电子健康记录(EHRs),构建了研究数据集。其次,针对 EHRs 中行为变量等非结构化数据,提出基于语言模型(LMs)的提示优化方法进行提取,确保数据本地化处理和隐私安全。最后,构建融合人口统计学、行为学和血液检测指标的深度学习模型,通过留一法交叉验证优化超参数,评估模型性能。

研究结果


  1. 患者特征与基本分析:研究人员从上海精神卫生中心收集了大量患者的电子健康记录,经过筛选,最终确定了 1546 例短期住院记录和 812 例长期住院记录。通过对这些数据进行详细分析,发现年龄、病程、婚姻状况等人口统计学变量,以及总胆红素、淋巴细胞等血液检测指标,都与长期住院存在显著关联。例如,年龄较大、病程较长的患者,更有可能需要长期住院治疗12
  2. 优化语言模型进行机密非结构化数据提取:研究人员提出了一种基于语言模型的提示优化方法,用于从非结构化文本中提取行为变量。经过多轮优化,该方法在提取行为变量时,准确率高达 94.2%,且能有效减少人工标注工作量。与传统的监督学习方法相比,优势明显34
  3. 使用综合指标预测 SCZ 患者长期住院风险:研究人员将人口统计学变量、行为变量和血液检测指标整合起来,构建了一个深度学习模型。经过测试,该模型预测长期住院风险的 AUC 达到 0.9,准确率为 0.81,远远超过了传统机器学习方法。这表明该模型能有效识别长期住院患者的特征,为临床预测提供了有力支持56
  4. 综合可解释性分析揭示相关因素关联:通过主成分分析和 SHapley Additive exPlanations(SHAP)分析,研究人员发现年龄、病程、婚姻状况、炎症标志物、淋巴细胞百分比、白蛋白等因素,都与精神分裂症患者长期住院密切相关。这些发现为深入了解长期住院风险的影响因素提供了新视角78
  5. 消融研究和案例分析验证多变量有效性:通过逐步添加不同类型变量进行消融实验,研究发现血液检测指标和行为变量的加入,显著提升了模型预测性能,AUC 分别提高了 6.25% 和 3.75%。案例分析也表明,多维度变量的纳入,能更全面、准确地预测患者住院时长,为医疗资源分配和个性化治疗提供依据910
  6. 信息提取范式的优势:研究人员的信息提取范式在多个方面表现出色。在外部合成数据集测试中,准确率高达 95%;面对种族、性别偏见和错误信息依赖等干扰时,传统监督学习方法性能大幅下降,而该范式却不受影响,充分展示了其优越性1112
  7. 中间住院时长患者的相关性分析:研究人员对住院时长在 30 - 120 天的患者进行了分析,发现模型在零样本学习模式下,预测概率与实际住院时长的相关性高达 0.213,优于其他机器学习方法,进一步证明了模型的有效性1314

研究结论与讨论


这项研究通过整合人口统计学、行为学和血液检测指标,利用先进的深度学习技术,成功开发出一种预测精神分裂症患者长期住院风险的模型。该模型不仅准确性高,还能深入揭示影响长期住院的关键因素,为临床医生在患者入院时制定个性化治疗方案和合理分配医疗资源提供了科学依据。

然而,研究也存在一些局限性。基于语言模型的信息提取在处理长而复杂的文本时可能会出现问题,而且研究数据仅来自一家精神卫生中心,可能影响研究结果的普适性。此外,模型未考虑药物依从性、社会支持等因素。尽管如此,该研究依然为精神卫生记录处理和个性化医疗指导开辟了新的道路,未来有望在更多元化、多中心的数据基础上进行验证和完善,为精神分裂症患者的治疗带来更大的帮助。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号