SynaptopathyDB:整合突触蛋白质组与遗传表型数据,揭示神经系统疾病新机制

《Scientific Reports》:SynaptopathyDB integrates synaptic proteomes, genetic and phenotypic data to advance research on nervous system disorders

【字体: 时间:2025年12月03日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对突触病(synaptopathy)研究中数据分散的瓶颈,开发了SynaptopathyDB在线平台,整合64项哺乳动物突触蛋白质组数据及OMIM、ICD-11等多源遗传表型资源。研究通过严格筛选获得3,437个高置信度突触蛋白(SynProteomeCONS),发现其中954个基因突变与1,266种中枢/周围神经系统疾病相关,显著富集于癫痫、运动障碍及认知表型(如HPO术语P<10-45)。该平台为解析突触蛋白变异与疾病表型关联提供了系统化工具,推动靶向治疗开发。

  
当我们谈论大脑疾病时,无论是阿尔茨海默病、癫痫还是精神分裂症,科学家们逐渐意识到一个问题:许多病症的根源可能藏在神经元之间那些微小的连接点——突触中。突触是神经信号传递的关键结构,其蛋白质组成的异常(即突触病)已被证实与数百种神经系统疾病相关。然而,随着基因组学和蛋白质组学数据的爆炸式增长,研究人员面临一个严峻挑战:海量的突触蛋白数据、基因突变信息和临床表型记录分散在不同数据库中,缺乏统一平台进行整合分析。这不仅阻碍了对疾病机制的深入理解,也拖慢了精准医疗的开发步伐。
为解决这一难题,由Oksana Sorokina、Digin Dominic等来自英国爱丁堡大学的研究团队在《Scientific Reports》上发表了最新研究成果。他们开发了一个名为SynaptopathyDB的在线资源(www.synaptopathydb.org),首次系统整合了64项哺乳动物突触蛋白质组研究数据与OMIM(Online Mendelian Inheritance in Man)、ICD-11(International Classification of Diseases)、HPO(Human Phenotype Ontology)等权威遗传表型数据库,构建了一个可搜索、可可视化分析的一站式平台。
为了建立高置信度的突触蛋白参考集,团队从超过8,000个候选蛋白中筛选出在至少5项独立研究中被重复验证的3,437个蛋白,定义为SynProteomeCONS。进一步根据突触亚结构定位,将其划分为突触后终端特有蛋白集(SynProteomePOST,1,354个蛋白)、突触前终端及共有蛋白集(SynProteomePRE+,456个蛋白)以及未定位的突触体蛋白集(SynProteomeSYN,1,627个蛋白)。通过跨数据库关联分析,发现35.9%的SynProteomeCONS基因(1,236个)携带OMIM疾病相关突变,其中78%(954个基因)直接导致中枢或周围神经系统疾病。
疾病类型分析显示,突触基因突变高度富集于ICD-11的第8章(神经系统疾病,343个基因)、第6章(精神行为或神经发育障碍,227个基因)、第20章(发育异常,227个基因)及第5章(内分泌/代谢疾病,316个基因)。值得注意的是,突触前蛋白集(SynProteomePRE+)在神经系统疾病中显著富集(p=2.4×10-8),而突触后蛋白集(SynProteomePOST)与精神神经发育障碍关联更强(p=7.9×10-6)。在神经系统疾病亚类中,癫痫和运动障碍相关基因数量最多,且主要由CNS表型主导。
表型层面,研究通过HPO富集分析识别出739个显著富集的表型术语,其中18个核心神经系统表型(如认知障碍、运动异常)的富集显著性达到P<10-5–10-45。进一步聚类显示,认知、运动和癫痫表型在异常神经系统生理类别中高度集中,提示突触基因突变对特定神经功能模块的破坏具有选择性。
值得注意的是,疾病发现时序分析显示,突触基因相关疾病的年发现量在2013年达到峰值后持续下降,截至2024年累计发现1,768种疾病(含502种非神经系统疾病)。这一趋势暗示当前已知的突触疾病谱系已接近饱和,但SynProteomeCONS中仍有64%的基因尚未与疾病关联,为未来研究留下广阔空间。
关键技术方法概述
研究团队通过手动筛选PubMed中2000年以来的突触蛋白质组研究,整合64项数据集并统一映射至Entrez、UniProt等标准基因标识。采用至少5次独立实验重复的阈值筛选高置信度突触蛋白,利用超几何检验和错误发现率校正进行基因-表型富集分析,并通过HPO、ICD-11等 ontology 工具标准化疾病分类。平台采用React.js与Flask框架构建,支持多标识符检索及API数据导出。
研究结果
Identifying a consensus set of synapse proteins
通过64项研究整合,团队定义了3,437个高重现性突触蛋白(SynProteomeCONS),并进一步划分为突触后(SynProteomePOST)、突触前(SynProteomePRE+)和未定位突触体(SynProteomeSYN)三个亚集,为后续分区功能分析奠定基础。
Disease-relevant genetic variants target all synapse compartments
跨数据库分析显示,突触前区疾病基因富集度最高(84.4%与神经系统疾病相关),且CNS表型在各类突触区均占主导(57-62%),证明突触各功能区均易受遗传变异影响。
Types of brain diseases and their phenotypes
ICD-11章节分布揭示突触突变集中于神经系统疾病、精神发育障碍、发育异常及代谢疾病四大类。表型富集分析进一步明确认知、运动及癫痫为核心表型模块,体现突触功能障碍的表型特异性。
Declining rate of discovery of diseases linked to synapse mutations
疾病发现曲线表明突触疾病谱系发现进入平台期,但多数突触蛋白基因尚未与疾病关联,提示未来研究方向可能转向复杂表型或非经典突触功能探索。
讨论与意义
SynaptopathyDB的建立标志着突触病研究从分散数据走向系统化整合。该平台不仅提供基因-疾病-表型关联查询功能,还通过可视化工具揭示疾病发现趋势和表型聚类规律。研究证实突触蛋白变异对神经系统疾病的广泛影响,尤其凸显突触前区在神经系统疾病中的关键作用。此外,突触蛋白表达的时空特异性(如synaptome mapping研究提示的脑区差异)为解释表型特异性提供了新视角。未来通过结合单突触分辨率空间蛋白质组技术,SynaptopathyDB有望在精准医疗中指导靶向突触的治疗策略开发。团队计划每年更新数据库,持续推动对突触病机制的深度解析。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号