《Cell》大语言模型解构自闭症诊断背后的临床直觉:改写诊断标准的新契机

《Cell》:Large language models deconstruct the clinical intuition behind diagnosing autism

【字体: 时间:2025年03月27日 来源:Cell 45.5

编辑推荐:

  当前,利用基因组检测或脑扫描诊断自闭症效果不佳,临床直觉仍是金标准。研究人员开展了利用大语言模型(LLMs)解构临床直觉的研究,发现重复刻板行为等对自闭症诊断更关键,这为修订诊断标准提供依据,有助于优化诊断工具。这项研究发表在《Cell》杂志上

  

在当今社会,自闭症已成为一个备受关注的神经发育障碍问题,大约 1%-2% 的人符合当前自闭症的诊断标准。多年来,科研人员一直致力于寻找客观的诊断指标,期望能像找到其他疾病的生物标志物那样,为自闭症诊断提供精准依据。于是,他们在复杂的生物数据中探寻,像常见的基因变异图谱(全基因组关联研究,GWAS)和脑成像记录(磁共振成像,MRI),这些在生物医学领域广泛应用的高通量技术,承载着科研人员的希望。

然而,现实却给了他们沉重一击。尽管投入了大量的人力、物力和财力,这些方法却未能在日常临床诊断中发挥作用。以基因检测为例,自闭症具有高度遗传性,可遗传特质的基础分散在基因组众多微小的遗传差异中,这使得寻找可靠的基因标记困难重重。多基因风险评分(PRSs)虽试图解决这一问题,但大规模研究显示,其自闭症 PRS 模型仅能解释 2% 的自闭症特质观察变异。机器学习算法在诊断自闭症方面也不尽人意,不同种族样本测试时准确率差异大。脑成像技术同样面临挑战,从早期的研究到后来深度学习的应用,虽然准确率有所提升,但仍无法满足临床需求,从脑扫描中获取的关于自闭症的信息似乎十分有限。


在生物标志物难以突破的情况下,临床医生凭借多年训练和实践积累的临床直觉,成为自闭症诊断的 “中流砥柱”。但传统诊断指南在实施过程中出现偏差,与 20 年前相比,如今诊断所需的症状项目减少了一半。因此,深入挖掘临床直觉,从中获取对自闭症诊断更有价值的信息,成为当务之急。


来自加拿大的研究团队,包括 Mila - 魁北克人工智能研究所、蒙特利尔神经学研究所(MNI)等机构的研究人员,开展了一项别具一格的研究。他们利用大语言模型(LLMs),对超过 1000 名疑似自闭症儿童的 4000 多份数字健康记录进行分析,试图解构临床直觉背后的逻辑。研究人员首先使用预训练的通用语言模型,在大量通用文本上进行训练,然后在精心收集的临床数据集上进行微调,以预测自闭症诊断。为了实现可解释性,他们构建了一个可训练的单头注意力模块,作为语言模型框架的最后一层,该模块能够精准定位和标记对诊断至关重要的句子。


在研究过程中,研究人员采用了多种关键技术方法。首先,利用谷歌云平台的光学字符识别(OCR)技术,将扫描的医疗记录转换为文本格式,为后续分析做准备。接着,选择在大量法语语料上预训练的 FlauBERT(基于 RoBERTa 架构)语言模型,对其进行微调,使其适应自闭症诊断任务。同时,引入单头注意力机制,增强模型的可解释性,通过 5 折交叉验证评估模型性能。此外,还运用主成分分析(PCA)等方法对模型内部进行分析,并利用余弦相似度等指标评估模型与外部诊断标准的关联。


研究结果令人瞩目:


  • 语言模型提取语义信息:经过微调的语言模型在独立报告上实现了 79.4% 的诊断分类准确率,显著优于传统自然语言处理方法,如标准词袋(BOW)模型和 Doc2Vec 算法。这表明该模型能够从非结构化的临床记录中有效提取相关信息,进而反映临床诊断思路。通过 PCA 分析发现,语言模型在微调后形成了一个有意义的自闭症感知嵌入空间,与自闭症诊断相关的句子能够与无关句子区分开来。并且,随着模型对报告信息的逐层处理,句子嵌入逐渐变得与诊断更加相关,在第 12 层达到最高诊断性能。

  • 单头注意力模块解析关键句子:单头注意力模块成功找出了对自闭症诊断最为重要的句子,这些句子包含与自闭症相关的特定词汇,如 “拍打”“模仿言语”“字母” 等。对这些句子中词汇的频率分析显示,与非自闭症报告相比,自闭症确诊报告中与重复运动、特殊兴趣和感官处理相关的词汇出现频率更高。这进一步证明了该模块能够精准定位与自闭症诊断紧密相关的信息。

  • 重新审视 DSM-5 标准:研究人员将 DSM-5 的七个自闭症诊断标准嵌入语言模型空间,通过计算余弦相似度发现,B1(刻板或重复的运动、物体使用或言语)、B3(高度受限、固定的兴趣,强度或焦点异常)和 B4(对感官输入的过度或低反应性,或对环境感官方面的异常兴趣)标准与自闭症相关句子更为相似,而 A1-A3(社交沟通和互动缺陷相关标准)和 B2(坚持相同性、不灵活遵守常规或仪式化行为相关标准)则携带较少的自闭症关键信息。此外,基于这些余弦相似度训练的线性判别分析(LDA)模型,能够以 0.905 的平均 AUC 预测自闭症诊断,进一步验证了这些发现。


在讨论部分,研究人员指出,当前对自闭症的定义和诊断标准存在诸多争议。长期以来,自闭症研究和临床实践过度关注社交缺陷,然而本研究发现,重复和刻板的感知行为、特殊兴趣和感官反应性才是更具自闭症特征的标准。现行的 DSM-5 标准在权重设置上,对社交缺陷标准的强调过多,而对重复行为等标准重视不足。实际上,重复行为等在自闭症诊断中更具特异性和可评估性,相比之下,社交技能在不同神经发育和精神疾病中表现相似,且更易随时间变化。此外,现有诊断工具往往关注自闭症儿童的缺陷,忽视了他们的认知和感知优势。基于此,研究人员认为有必要重新审视自闭症的诊断标准,这不仅有助于提高诊断的准确性,还可能为干预和治疗策略的制定提供新的方向。


这项研究发表在《Cell》杂志上,其意义重大。它揭示了大语言模型在解构临床直觉方面的巨大潜力,为重新认识自闭症诊断标准提供了实证依据。这一成果有望推动自闭症诊断工具的改进,使其更加精准和有效。同时,也为其他精神疾病的研究和诊断提供了新思路,促使科研人员更加重视临床经验与先进技术的结合,为精神医学领域的发展注入新的活力。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
    生物通微信公众号
    微信
    新浪微博

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号