编辑推荐:
帕金森病(PD)神经精神波动影响患者生活质量,临床评估存在困难。研究人员分析 33 名 PD 患者在 ON 和 OFF 药物状态下的自发言语内容,使用机器学习和大语言模型(LLMs)预测药物状态和神经精神状态评分。LLMs 的 Gemma-2(9B)表现最佳,这为 PD 治疗效果评估和远程监测提供了新方法。
帕金森病(Parkinson’s disease,PD)是一种复杂的神经退行性疾病,除了运动症状外,其神经精神症状如情绪变化、抑郁、焦虑等对患者生活质量的影响不容小觑。随着疾病进展,多巴胺能替代疗法虽能缓解症状,但会导致症状波动,即神经精神波动。“OFF” 药物状态下,患者常感到疲劳、情绪低落;“ON” 药物状态下,则可能表现为话多、欣快等。然而,临床实践中对这些波动的评估存在局限,患者也难以准确回顾自身症状变化,这给精准治疗带来挑战。
为了解决这些问题,来自瑞士伯尔尼大学 ARTORG 生物医学工程研究中心老年技术与康复小组、伯尔尼大学医院神经内科等多个机构的研究人员开展了一项研究,相关成果发表在《npj Parkinson's Disease》上。
研究人员采用的主要技术方法包括:招募符合运动障碍协会标准的波动型 PD 患者,在其进行左旋多巴激发试验时,系统记录他们在 ON 和 OFF 药物状态下的自发言语;使用神经精神波动量表(NFS)量化神经精神波动,用运动障碍协会统一帕金森病评定量表(MDS-UPDRS)评估运动症状等;利用 OpenAI 的自动语音识别工具 Whisper 将语音样本转录为文本并翻译为英文;通过语义搜索、机器学习模型和大语言模型三种方法对药物状态进行分类,并预测神经精神状态评分,使用留一法交叉验证评估模型性能。
研究结果
- 参与者:35 名 PD 患者参与研究,1 名因诊断修订、1 名因回答为单字被排除,最终 33 名患者纳入分析。参与者平均年龄 64 ± 7.7 岁,疾病持续时间 10.3 ± 3.4 年,详细人口统计学和临床信息见相关表格。
- ON-OFF 药物状态分类:语义搜索方法使用 “multiqa-mpnet-base-dot-v1” 模型计算文本嵌入,选取前 5 个最相似的 NFS 项目投票,分类准确率达 0.85。机器学习方法中,RF 和 SVM 应用于 “Alibaba-NLP/gte-Qwen2-1.5B-instruct” 文本嵌入时,准确率和 F1 分数为 0.92。LLMs 中的 Gemma-2(9B)和 Llama-3.1(8B)在少样本设置下准确率达 0.98,ROC 曲线下面积(AUC)为 0.99,表现最佳。
- 神经精神状态评分预测:语义搜索方法在考虑前 5 个最相似患者录音时,均方根误差(RMSE)为 14.0。RF 模型以 “Alibaba-NLP/gte-Qwen2-1.5B-instruct” 嵌入为输入,RMSE 为 11.2,平均绝对误差(MAE)为 8.68。LLM “gemma-2-9b” 在 9 次射击设置下,RMSE 为 10.66,MAE 为 8.1,与实际神经精神状态评分相关性最强(Spearman’s ρ=0.81,p<0.001)。
研究结论与讨论
该研究表明,通过分析患者言语内容来预测 PD 患者药物状态和神经精神波动是可行的。LLMs 在分类药物状态和预测神经精神状态评分方面表现出色,但也存在一些问题,如模型解释的可靠性、校准问题等。语义搜索方法虽准确率稍低,但能提供与 NFS 项目相关的补充信息。此外,研究存在样本量较小、评估顺序可能影响结果、NFS 评分未大规模验证、自动转录可能产生幻觉等局限性。
尽管如此,该研究意义重大。它为 PD 治疗效果评估提供了更全面的方法,有望通过移动设备实现远程神经精神症状监测,从而为患者提供更及时、个性化的治疗策略调整,改善患者生活质量,也为后续研究奠定了基础,推动了帕金森病诊疗领域的发展。