机器学习模型能否精准预测心理健康状况?这项研究给出答案

《Molecular Psychiatry》:Generalizability of clinical prediction models in mental health

【字体: 时间:2025年03月20日 来源:Molecular Psychiatry 9.6

编辑推荐:

  为探究机器学习(ML)模型对抑郁症状严重程度的预测能力,研究人员经多队列研究发现该模型有良好泛化性,意义重大。

  在精神健康领域,准确预测抑郁症状的发生和患者个体的疾病发展轨迹,一直是困扰医疗人员的难题。目前,临床决策缺乏有力的数据支持,现有的机器学习(ML)模型虽然能在单一研究数据集内进行相关预测,但在不同治疗环境、国家或年龄组的独立数据中,其有效性却难以保证。并且,现实世界临床人群和研究队列的数据存在差异,这也影响了模型的预测准确性和泛化性。更麻烦的是,精神科缺乏统一的数据标准和共享本体,使得结构化临床信息难以广泛收集和应用。在这样的背景下,为了突破困境,来自德国耶拿大学医院、明斯特大学等多所欧洲研究机构的研究人员展开了深入研究。他们的研究成果发表在《Molecular Psychiatry》上,为精神健康领域的发展带来了新的希望。
研究人员采用了多队列研究方法,收集了来自十个欧洲研究和临床机构的 3021 名参与者的数据。这些参与者年龄在 15 - 81 岁之间,均被诊断患有情感障碍,涵盖了不同疾病阶段,包括近期发作性抑郁症(ROD)、持续性抑郁症(PDD)等。研究人员将这些数据分为研究样本和现实世界样本,其中研究样本来自两项神经影像学队列研究,现实世界样本则来自自然主义研究。

研究中,研究人员运用了弹性网络算法和十折交叉验证等关键技术。首先,他们从 76 个临床和社会人口学变量中,通过排列重要性分析确定了影响模型性能的五个主要变量,即神经质(Neuroticism)、外向性(Extraversion)、全球功能评估(Global Assessment of Functioning,GAF)、躯体化(Somatization)和童年情感虐待(Emotional Abuse in Childhood)。接着,基于这些变量训练了一个稀疏模型,并在不同的样本中进行验证。

研究结果如下:

  • 样本差异分析:研究样本和现实世界样本在多个维度上存在显著差异,如现实世界样本的患者当前抑郁症状在外部评估中更严重,疾病进程更严重,用药情况、童年虐待回忆和人格维度也与研究样本不同。不过,除了躯体症状外,其他维度的差异并未阻碍模型的泛化。
  • 模型性能验证:训练的稀疏模型在现实世界样本中的表现优于随机水平( ,span data-custom-copy-text="\(p0.001\)" ),在所有外部数据集上也表现出色( ,span data-custom-copy-text="\(p0.001\)" ),对应的分类场景准确率达到 80%。在不同样本中,模型性能虽有差异,但即使在表现最差的现实世界普通人群样本中( ),其性能也在可接受范围内。
  • 跨时间点预测:在评估治疗后的抑郁症状严重程度时,稀疏模型同样表现出高于随机水平的性能( ,span data-custom-copy-text="\(p0.001\)" ),对应分类场景准确率为 75%。不过,不同站点的模型性能有所不同,治疗时间较长的现实世界门诊患者 6 号站点模型表现相对较差,这可能与治疗时间和模型误差的正相关关系有关。
  • 严重抑郁无反应者分类:研究人员尝试用该模型识别严重抑郁症状患者,通过留一站点交叉验证和合成少数过采样技术(SMOTE)结合编辑最近邻(ENN)的方法,模型预测持续严重抑郁的平均平衡准确率达到 0.66,不同站点的性能有所差异。
  • 敏感性分析:研究人员还进行了敏感性分析,发现年龄和性别与模型误差均无显著关联。并且,即使排除原始模型中权重较高的神经质和全球功能变量,模型仍具有良好的泛化性能。

综上所述,该研究表明基于稀疏临床数据训练的 ML 模型,在预测不同环境、治疗阶段的抑郁症状严重程度方面具有良好的泛化性。这一成果为开发更具普适性的精神科数据分析工具提供了重要依据,尽管模型还不能直接用于临床决策支持,但为未来开发适用于日常临床使用的模型奠定了基础。同时,研究也指出,应重视临床数据的结构化采集,提高数据的互操作性,推动精神科标准化数据格式和本体的发展,以更好地应用 ML 模型。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号