《Molecular Psychiatry》:Generalizability of clinical prediction models in mental health
编辑推荐:
为探究机器学习(ML)模型对抑郁症状严重程度的预测能力,研究人员经多队列研究发现该模型有良好泛化性,意义重大。
在精神健康领域,准确预测抑郁症状的发生和患者个体的疾病发展轨迹,一直是困扰医疗人员的难题。目前,临床决策缺乏有力的数据支持,现有的机器学习(ML)模型虽然能在单一研究数据集内进行相关预测,但在不同治疗环境、国家或年龄组的独立数据中,其有效性却难以保证。并且,现实世界临床人群和研究队列的数据存在差异,这也影响了模型的预测准确性和泛化性。更麻烦的是,精神科缺乏统一的数据标准和共享本体,使得结构化临床信息难以广泛收集和应用。在这样的背景下,为了突破困境,来自德国耶拿大学医院、明斯特大学等多所欧洲研究机构的研究人员展开了深入研究。他们的研究成果发表在《Molecular Psychiatry》上,为精神健康领域的发展带来了新的希望。
研究人员采用了多队列研究方法,收集了来自十个欧洲研究和临床机构的 3021 名参与者的数据。这些参与者年龄在 15 - 81 岁之间,均被诊断患有情感障碍,涵盖了不同疾病阶段,包括近期发作性抑郁症(ROD)、持续性抑郁症(PDD)等。研究人员将这些数据分为研究样本和现实世界样本,其中研究样本来自两项神经影像学队列研究,现实世界样本则来自自然主义研究。
研究中,研究人员运用了弹性网络算法和十折交叉验证等关键技术。首先,他们从 76 个临床和社会人口学变量中,通过排列重要性分析确定了影响模型性能的五个主要变量,即神经质(Neuroticism)、外向性(Extraversion)、全球功能评估(Global Assessment of Functioning,GAF)、躯体化(Somatization)和童年情感虐待(Emotional Abuse in Childhood)。接着,基于这些变量训练了一个稀疏模型,并在不同的样本中进行验证。
研究结果如下:
样本差异分析 :研究样本和现实世界样本在多个维度上存在显著差异,如现实世界样本的患者当前抑郁症状在外部评估中更严重,疾病进程更严重,用药情况、童年虐待回忆和人格维度也与研究样本不同。不过,除了躯体症状外,其他维度的差异并未阻碍模型的泛化。
模型性能验证 :训练的稀疏模型在现实世界样本中的表现优于随机水平(r 350 ? = 0.73 ,span data-custom-copy-text="\(p0.001\)"p < 0.001 ),在所有外部数据集上也表现出色(r 2673 ? = 0.60 ,S D = 0.089 ,span data-custom-copy-text="\(p0.001\)"p < 0.001 ),对应的分类场景准确率达到 80%。在不同样本中,模型性能虽有差异,但即使在表现最差的现实世界普通人群样本中(r 1227 ? = 0.48 ),其性能也在可接受范围内。
跨时间点预测 :在评估治疗后的抑郁症状严重程度时,稀疏模型同样表现出高于随机水平的性能(r 566 ? = 0.50 ,span data-custom-copy-text="\(p0.001\)"p < 0.001 ),对应分类场景准确率为 75%。不过,不同站点的模型性能有所不同,治疗时间较长的现实世界门诊患者 6 号站点模型表现相对较差,这可能与治疗时间和模型误差的正相关关系有关。
严重抑郁无反应者分类 :研究人员尝试用该模型识别严重抑郁症状患者,通过留一站点交叉验证和合成少数过采样技术(SMOTE)结合编辑最近邻(ENN)的方法,模型预测持续严重抑郁的平均平衡准确率达到 0.66,不同站点的性能有所差异。
敏感性分析 :研究人员还进行了敏感性分析,发现年龄和性别与模型误差均无显著关联。并且,即使排除原始模型中权重较高的神经质和全球功能变量,模型仍具有良好的泛化性能。
综上所述,该研究表明基于稀疏临床数据训练的 ML 模型,在预测不同环境、治疗阶段的抑郁症状严重程度方面具有良好的泛化性。这一成果为开发更具普适性的精神科数据分析工具提供了重要依据,尽管模型还不能直接用于临床决策支持,但为未来开发适用于日常临床使用的模型奠定了基础。同时,研究也指出,应重视临床数据的结构化采集,提高数据的互操作性,推动精神科标准化数据格式和本体的发展,以更好地应用 ML 模型。
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》