基于蛋白质互作可解释图传播网络的神经退行性疾病血浆蛋白质组学生物标志物研究

【字体: 时间:2025年05月30日 来源:Briefings in Bioinformatics 6.8

编辑推荐:

  本研究针对神经退行性疾病诊断中脑脊液检测和神经影像学的侵入性及高成本问题,开发了PPIxGPN(Protein-Protein Interaction-based explainable Graph Propagational Network)模型。该模型通过整合蛋白质互作网络(PPI)与蛋白质独立效应,实现了对Aβ42/40、GFAP、NfL和pTau四种血浆生物标志物的风险预测,AUROC达0.780。其创新的全局特征聚合和双层浅层架构设计,在保持高解释性的同时显著提升预测性能,为临床决策提供了可靠的分子机制解读工具。

  

神经退行性疾病的早期诊断一直面临重大挑战。目前依赖的脑脊液检测存在侵入性风险,而PET和MRI等神经影像技术又价格昂贵。更棘手的是,血浆生物标志物如Aβ42/40、GFAP、NfL和pTau虽然检测便捷,但现有机器学习方法往往忽视蛋白质间的协同效应,且复杂模型缺乏临床所需的可解释性。这些瓶颈严重制约了精准医疗的发展。

韩国Ajou大学医学院的研究团队在《Briefings in Bioinformatics》发表的研究中,创新性地提出了PPIxGPN模型。这项研究通过整合UK Biobank队列中906名参与者的1463种血浆蛋白质数据,构建了包含113个靶蛋白的互作网络,开发出兼具高预测性能和临床解释性的新型算法。

研究采用三大关键技术:1)基于STRING数据库构建加权PPI网络(含234个互作);2)开发全局特征聚合的单层图传播算法,通过封闭解实现全网络信息整合;3)结合SHAP值(SHapley Additive exPlanations)和双层参数架构实现模型可解释性。实验采用100次五折交叉验证,并与7种主流图神经网络对比。

【数据描述】研究从UK Biobank筛选906例具有完整Aβ42/40、GFAP、NfL和pTau数据的样本,其中783例有平均3.25年随访数据。通过Olink平台检测1463种血浆蛋白,经质控后保留1412种进行差异表达分析。

【蛋白组学分析】鉴定出113个在四种标志物中均差异表达的靶蛋白(如NEFL、WFDC2、GDF15)。功能富集显示这些蛋白显著富集于细胞因子和免疫系统通路,印证了神经炎症在疾病中的作用。

【网络构建】基于STRING数据库构建的PPI网络包含93个互作蛋白,平均节点度5.03,其中TNFRSF1A互作最多(度=19)。网络中包含20个功能互作、14个物理互作和47个调控互作。

【性能评估】PPIxGPN在AUROC(0.780)、AUPRC等指标上平均优于对比模型9.6%,其中NfL预测最佳(AUROC=0.791)。实验证实:1)增加网络密度可提升性能,全网络比20%子网高4.8%;2)功能互作子网表现最优(AUROC=0.761)。

【解释性分析】传播参数(φ)平均1.25,与蛋白波动呈负相关(r=-0.18)。协同效应使79个靶蛋白表达降低,标准差增大27.4倍。SHAP分析鉴定出19个关键蛋白(如NEFL、GFAP、KLK4),其风险评分区分度提升164.6%。

【生存分析】高风险组(评分>0.5)的转化风险显著增高:NfL的HR=3.518(95%CI:2.296-5.390),证实模型预测与疾病进展的强关联。

这项研究突破了传统机器学习模型的局限性,首次实现PPI网络全局特征的医学可解释整合。其创新性体现在:1)通过单层封闭解替代多层堆叠,兼顾计算效率与生物学合理性;2)识别出NEFL等关键蛋白的协同作用模式;3)证实血浆GFAP等标志物与长期预后的关联。尽管存在单队列研究的局限,但PPIxGPN为神经退行性疾病的早期诊断提供了新范式,其"网络生物学+可解释AI"的研究框架,对阿尔茨海默病等复杂疾病的机制解析具有重要启示。未来通过整合多组学数据和临床指标,有望进一步发展成为临床决策支持工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号