
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于双视角图卷积网络的帕金森病亚型识别:整合全血表达数据的时空特征
【字体: 大 中 小 】 时间:2025年08月13日 来源:BMC Bioinformatics 3.3
编辑推荐:
本研究针对帕金森病(PD)临床异质性难题,提出DualGCN-GE方法,通过整合全血RNA-seq数据的时空特征实现PD-PACE亚型精准分型。研究团队创新性地构建帕金森特异性基因网络(PGG)作为拓扑特征,结合双视角图卷积网络融合基因表达时序特征与分子网络结构畸变信息,在PPMI和PDBP数据集上验证了模型优越性,为神经退行性疾病精准诊疗提供了新范式。
帕金森病作为典型的神经退行性疾病,其临床表现和进展轨迹存在显著异质性,这种"千人千面"的特性给精准诊疗带来巨大挑战。传统单视角学习方法仅关注基因表达量的时序变化,却忽视了分子网络的结构畸变特征,犹如仅观察河流水位而忽略河道拓扑变化,难以全面捕捉疾病本质。更棘手的是,血脑屏障的存在使得外周血表达数据信噪比低,常规深度学习模型往往"力不从心"。
浙江理工大学计算机科学与技术学院的研究团队在《BMC Bioinformatics》发表创新成果,提出DualGCN-GE双视角图学习框架。该方法突破性地将帕金森特异性基因网络(PGG)作为拓扑特征,与表达量时序特征协同分析,犹如为疾病检测装上"时空双镜",在PPMI和PDBP队列中实现了PD-PACE亚型的精准识别。
研究采用三大关键技术:1)基于多尺度嵌入基因共表达分析(MEGENA)构建PGG网络;2)设计双视角GCN分别提取基因表达嵌入(XE)和拓扑嵌入(XT);3)采用交叉注意力机制(CA)融合时空特征。实验数据来自帕金森进展标志物倡议(PPMI)和帕金森生物标志物计划(PDBP)数据库的全血转录组。
【提取帕金森特异性基因图谱】
通过计算基因对相关系数C(i,j)构建PGG网络,发现核心调控模块呈现显著拓扑重构。如图3所示,GO分析证实这些模块与PD病理过程密切相关,其结构畸变可能是疾病进展的"分子指纹"。
【双视角特征提取】
改进的图聚合函数(公式7)引入可学习超参数δ(Sv),动态调整边权重以捕捉关键节点。同时,双层CNN提取的表达特征XE与拓扑特征XT形成互补视角,为后续融合奠定基础。
【时空表征融合】
创新性采用交叉注意力机制(公式11)建立双视角交互,生成的联合表征Yjoint较直接拼接策略F1值提升21.7%。如图4所示,该方法在PPMI-B七分类任务中达到0.785召回率,显著优于单视角模型。
【模型验证】
在PPMI和PDBP数据集上的五折交叉验证显示,DualGCN-GE的AUC值最高达0.809(表2)。特别值得注意的是,PGG拓扑特征在识别快速进展亚型(PDvec3)时贡献度达43%,证实结构特征蕴含独特诊断价值。
该研究开创性地将分子网络拓扑动力学引入PD亚型分析,其重要意义体现在三方面:首先,PGG作为新型生物标志物,为理解PD异质性提供了结构生物学视角;其次,双视角融合策略克服了外周血数据信噪比低的局限;最后,该方法框架可扩展至其他神经退行性疾病研究。正如讨论部分指出,未来可进一步探索动态基因网络的跨尺度调控机制,为精准医学开辟新途径。
生物通微信公众号
知名企业招聘