基于血清胆汁酸谱与机器学习模型构建帕金森病认知障碍风险分类新策略
《npj Parkinson's Disease》:Classifying the risk of cognitive impairment in Parkinson’s disease using serum bile acid profiles and machine learning
【字体:
大
中
小
】
时间:2025年12月09日
来源:npj Parkinson's Disease 6.7
编辑推荐:
本研究针对帕金森病(PD)认知障碍(CI)早期诊断缺乏客观生物标志物的临床难题,通过UPLC-MS/MS技术定量分析300例PD患者血清15种胆汁酸(BA)谱,发现PD-CI患者特征性表现为脱氧胆酸(DCA)升高和熊去氧胆酸(UDCA)等神经保护性BA降低。结合机器学习算法构建的7种BA标志物组合(DCA/LCA/GLCA/TCA/CA/TLCA/GCA)可有效区分PD-CI与认知正常PD患者(随机森林模型AUC达0.90),揭示BA代谢紊乱与PD认知衰退的密切关联,为PD相关CI的早期预警提供了新型代谢标志物。
当提及帕金森病,人们往往首先想到震颤、僵硬等运动症状,但认知障碍(CI)作为其常见且影响深远的非运动症状,约30%的帕金森病轻度认知障碍(PD-MCI)患者会进展为帕金森病痴呆(PDD)。目前临床常用的简易精神状态检查(MMSE)和蒙特利尔认知评估(MoCA)量表对帕金森病相关认知障碍的识别存在灵敏度不足、易遗漏早期或特定认知域缺损的问题。因此,探寻能够客观、精准识别帕金森病认知障碍风险的生物标志物,成为该领域亟待突破的关键。
近年来,肠道菌群-肠-脑轴在帕金森病发病机制中的作用日益受到关注。胆汁酸(BA)作为胆固醇在肝脏合成、并经肠道微生物代谢的产物,不仅是脂肪消化所必需,更是重要的信号分子,参与调节代谢、炎症乃至神经功能。研究表明,胆汁酸代谢紊乱与阿尔茨海默病(AD)等神经退行性疾病相关,但其在帕金森病认知衰退中的具体作用模式及诊断价值尚不明确。以往研究多受限于样本量小、检测技术灵敏度不足以及缺乏高级计算方法的整合。
为此,来自徐州医科大学附属医院等机构的研究团队在《npj Parkinson's Disease》上发表了最新研究成果。他们创新性地将超高效液相色谱-串联质谱(UPLC-MS/MS)技术的高精度胆汁酸定量分析与多种机器学习算法相结合,系统探究了帕金森病患者血清胆汁酸谱特征与认知状态的关系,并成功构建了能够有效区分认知正常(PD-NC)与认知障碍(PD-CI)帕金森病患者的风险预测模型。
研究团队主要运用了以下关键技术方法:首先,他们连续招募了300名特发性帕金森病患者和63名健康对照(HC),收集其临床资料和血清样本。随后,利用超高效液相色谱-串联质谱(UPLC-MS/MS)平台对血清中的15种胆汁酸进行了精确定量。在数据分析阶段,结合了多变量统计分析(如正交偏最小二乘判别分析OPLS-DA)以及多种机器学习算法(包括随机森林RF、支持向量机SVM、XGBoost等)来筛选关键胆汁酸标志物并构建分类模型。
研究共纳入63名健康对照、154名PD-NC和146名PD-CI参与者。三组在性别、年龄、吸烟饮酒史、高血压糖尿病患病率上无显著差异。然而,PD-CI组受教育年限显著更少,疾病病程更长,Hoehn-Yahr(H-Y)分期和MDS-UPDRS-III评分更高,MMSE和MoCA评分则阶梯式下降。常规生化指标显示,体重指数(BMI)、总胆固醇(TC)、低密度脂蛋白胆固醇(LDL)在健康对照组中高于两个帕金森病组,但两个帕金森病亚组间这些指标及肝功能参数(如ALT、AST)无差异,提示帕金森病相关的胆汁酸异常并非源于肝功能不全。与健康对照相比,所有帕金森病患者均表现出显著的胆汁酸代谢紊乱,包括胆酸(CA)、鹅脱氧胆酸(CDCA)、脱氧胆酸(DCA)、甘氨石胆酸(GLCA)和牛磺胆酸(TCA)升高,而石胆酸(LCA)、牛磺石胆酸(TLCA)、熊去氧胆酸(UDCA)、甘氨熊去氧胆酸(GUDCA)和牛磺熊去氧胆酸(TUDCA)降低。
进一步比较PD-CI与PD-NC组发现,PD-CI组血清CA、DCA和TUDCA水平显著升高,而GLCA、TCA和UDCA水平显著降低。多变量分析(OPLS-DA)显示两组血清胆汁酸谱存在分离,其中DCA、UDCA和GLCA是贡献最大的变量。随机森林和支持向量机分析也一致将DCA识别为最具区分能力的胆汁酸。
按血清DCA浓度中位数将参与者分为高DCA组和低DCA组。高DCA组中,基于MMSE和MoCA判定的认知障碍发生率均显著更高。Spearman相关分析显示,血清DCA水平与MMSE和MoCA总分均呈负相关,即使在控制了教育年限后,这种负相关依然显著。此外,高DCA参与者在所有七个认知域(定向力、记忆力、注意力、视空间能力、语言/命名、执行功能、计算力)的得分均显著低于低DCA组。
受试者工作特征(ROC)分析显示,单独使用DCA预测MMSE≥27和MoCA≥26的曲线下面积(AUC)分别为0.645和0.725,判别能力中等。通过LASSO逻辑回归进一步筛选出关键胆汁酸组合,对于MMSE预测,最终保留9种胆汁酸(DCA, LCA, CDCA, GLCA, TCA, TDCA, CA, TLCA, GCA),测试集AUC提升至0.715;对于MoCA预测,保留7种胆汁酸(DCA, LCA, GLCA, TCA, CA, TLCA, GCA),测试集AUC为0.737。取交集后,确定了一个包含7种胆汁酸(DCA, LCA, GLCA, TCA, CA, TLCA, GCA)的核心标志物组合。
基于上述7种胆汁酸标志物,研究人员训练了五种机器学习分类器。在测试集中,随机森林模型对MMSE≥27的预测性能最佳(AUC=0.777),对MoCA≥26的预测性能亦最优(AUC=0.833)。模型校准良好,特征重要性分析均显示DCA、GLCA和CA是贡献最大的预测因子。
仅使用临床变量(病程、H-Y分期、UPDRS-III评分、教育年限)的随机森林模型对MMSE≥27和MoCA≥26的预测AUC分别为0.697和0.783。而当通过随机森林递归特征消除(RF-RFE)将7种胆汁酸标志物与临床变量整合后,模型性能显著提升,对MMSE和MoCA的预测AUC分别达到0.841和0.901。DCA在整合模型中重要性排名第一。Delong检验证实,添加胆汁酸标志物后,模型判别性能较单纯临床模型有统计学意义的显著提高。
本研究通过高精度代谢组学与机器学习算法的深度融合,揭示了帕金森病认知障碍患者存在独特的血清胆汁酸谱改变,其特征是神经毒性次级胆汁酸DCA的积累和部分神经保护性胆汁酸的耗竭。DCA水平与认知功能呈显著负相关,且独立于教育等社会人口学因素。研究构建的多变量胆汁酸标志物组合,特别是与关键临床变量整合后,能高效区分帕金森病的认知状态,其性能优于单一胆汁酸或单纯临床模型。
这些发现表明,外周胆汁酸代谢紊乱与帕金森病认知衰退密切相关,血清胆汁酸谱有望成为辅助帕金森病相关认知障碍早期识别和风险分层的新型代谢生物标志物。该研究不仅为理解帕金森病认知障碍的病理生理机制提供了新的代谢视角,也展示了多组学数据与人工智能结合在神经系统疾病精准医疗中的巨大潜力。未来需要开展纵向、多中心研究,并整合微生物组、影像学及其他神经退行性标志物,进一步验证胆汁酸标志物的预测价值及其临床转化前景。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号