《npj Parkinson's Disease》:Explaining facial action units' correlation with hypomimia and clinical scores in Parkinson’s disease
编辑推荐:
研究针对早期帕金森病(PD)面部表情减少(hypomimia)问题,利用 XGBoost 模型分析面部动作单元(AU),为早期诊断和病情评估提供依据。
帕金森病(Parkinson’s disease,PD)是全球第二大常见的神经退行性疾病,它就像一个 “沉默的杀手”,悄无声息地破坏大脑中的多巴胺能神经元,主要影响运动系统。很多患者在出现运动症状时,其实大脑中多达 60% 的多巴胺能神经元已经受损,这意味着疾病在临床症状出现之前已经默默发展了很久。而面部表情减少(hypomimia),也就是我们常说的 “面具脸”,是早期 PD 的一个突出症状,患者面部运动和情感表达都变少,不仅影响患者的社交生活,还可能延误疾病的早期发现。
目前,虽然计算机视觉和机器学习技术在检测 PD 面部表情减少方面有一定进展,但现有研究存在不少问题。比如数据集规模不够大,机器学习模型缺乏可解释性,很少考虑生物性别对结果的影响,而且研究预测与临床评分之间相关性的也较少,对于面部特征和临床评分之间的关联研究也不够深入。
为了解决这些问题,来自法国巴黎综合理工学院电信南巴黎分校(Laboratoire SAMOVAR, Télécom SudParis, Institut Polytechnique de Paris)和法国索邦大学巴黎脑研究所(Sorbonne Université, Paris Brain Institute - ICM)等机构的研究人员开展了一项研究。他们的研究成果发表在《npj Parkinson's Disease》上,为早期 PD 的诊断和病情监测带来了新的希望。
研究人员采用了多种关键技术方法。首先,他们使用了基于《面部动作编码系统(Facial Action Coding System)》的 OpenFace 开源软件,从视频中识别出 17 个面部动作单元(AU),这些 AU 就像是面部表情的 “基本零件”,能描述各种面部表情。接着,通过计算 AU 强度的导数来提取特征,反映面部肌肉随时间的运动变化。然后,运用 5 折嵌套交叉验证(Nested cross-validation)和 XGBoost 模型进行分类,评估模型性能。此外,还利用 SHAP(SHapley Additive exPlanations)分析来解释模型预测,找出对区分 PD 和健康对照(HC)最重要的 AU。研究数据来自 ICEBERG Video - Feb2023 数据集,包含 109 名早期 PD 患者和 45 名健康对照者的视频记录。
下面来看具体的研究结果:
分类结果和 SHAP 解释 :研究人员通过 XGBoost 模型对视频进行分类,在视频访问层面,PD 与 HC 分类的平衡准确率(BA)达到 66%,曲线下面积(AUC)为 74.2%;在受试者层面,BA 为 71.5%,AUC 为 79.8%。SHAP 分析发现,最能区分 PD 和 HC 的 AU 主要集中在面部下半部分,如 AU15(唇角下拉肌)、AU17(下巴上提肌)等,除了 AU1(眉内侧上提肌)。而且,面部视频中 AU 导数的方差较低(蓝色点)更能预测 PD,这与面部表情减少时面部肌肉运动减少的特征相符。
生物性别的影响 :基于性别的分类结果显示,男性的 BA 为 74.8%,AUC 为 83.19%;女性的 BA 为 66%,AUC 为 73.68%,但差异并不显著。通过调整数据平衡后发现,女性分类结果较低主要是因为女性 PD 病情和面部表情减少程度较轻,而不是训练数据中男性数量较多导致的偏差。此外,双因素方差分析(Two-Way ANOVA)表明,17 个 AU 中有 12 个在疾病影响下具有统计学意义,且多数不受性别影响;双因素多变量方差分析(Two-Way MANOVA)也证实了疾病和性别的主效应显著,但两者的交互作用不显著。
面部 AU 特征的纵向分析 :对比 V0 (初始视频访问)和 Vf (最终视频访问)的分类结果,发现 V0 的各项指标似乎更好,但 DeLong 检验表明两者 AUC 差异不显著。单变量和多变量线性混合模型(LMM)分析显示,面部特征在时间上没有显著变化,PD 对这些特征的影响在 V0 和 Vf 之间相似,这可能与患者在这两个时间点的 MDS-UPDRS3(Movement Disorder Society revision of the Unified Parkinson’s Disease Rating Scale,运动障碍协会修订的统一帕金森病评定量表)和 MDS-face 评分没有显著差异有关。
相关性分析 :在 V0 时,发现 AU 与临床评分之间存在显著相关性,如 AU17 与左上肢僵硬、AU9 与颈部僵硬相关。同时,模型预测概率分数与临床评分在不同评估时间也存在显著相关性,如 MDS-UPDRS3 在 V0 和 Vf 都有部分相关性,颈部僵硬在两个时间点也相关。虽然概率分数与 MDS-face 评分的相关性未达到统计学意义,但趋势明显,MDS-face 评分越高,检测 PD 的准确率越高。然而,17 个 AU 与 DATScan 提取的参数之间未发现显著相关性,可能是实验中患者数量较少的原因。
研究结论和讨论部分意义重大。该研究的 AUC 达到 79%,BA 为 71.5%,表明在早期 PD 面部表情减少检测方面具有潜力。研究还发现模型能评估 PD 严重程度,虽然预测误差主要出现在早期 PD 患者中,但即使是 MDS-face = 0(无面部表情减少症状)的患者,XGBoost 模型仍能在访问层面正确分类 66%。此外,研究首次证实了面部 AU 与肢体僵硬之间的相关性,不过这种相关性在 Vf 不显著,可能与左旋多巴(LEVODOPA)的摄入有关。
未来,研究人员计划结合更多的语音任务,利用面部 AU 以多元方式评估临床评分。虽然该研究存在数据集相对较小、PD 和 HC 分布不平衡以及患者在服药状态下进行记录等局限性,但它为早期 PD 的诊断、病情监测和个性化治疗提供了重要的参考依据,有望推动相关技术在临床实践中的应用,改善 PD 患者的生活质量。
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》