基于生物信息学与机器学习的缺血性脑卒中翻译后修饰相关生物标志物鉴定研究

《Scientific Reports》:Identification of post-translational modification-related biomarkers in ischemic stroke using bioinformatics and machine learning

【字体: 时间:2025年11月12日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对缺血性脑卒中(IS)早期诊断困难、病理机制不清的临床挑战,通过整合生物信息学与机器学习方法,系统分析了外周血转录组数据,筛选出ATG7、KAT2A、RNF20、UBA1、UBE2I和USP15等6个PTM相关诊断标志物,构建的人工神经网络(ANN)模型诊断AUC达0.95以上,并发现ETYA与UBE2I/KAT2A具有潜在相互作用,为IS的快速诊断和靶向治疗提供了新策略。

  
当大脑的血液和氧气供应被突然中断,脑组织就会像缺水的禾苗一样迅速枯萎——这就是缺血性脑卒中(Ischemic Stroke, IS)发生的可怕过程。作为占所有卒中类型83%的主要疾病,IS全球致死率高达5.2%,但临床诊断仍严重依赖耗时耗力的影像学检查,而传统药物治疗又存在起效慢、特异性差等局限。即使是被指南推荐为首选的溶栓治疗,也因严格的时间窗和适应证让多数患者望而却步。在这种背景下,寻找快速诊断的生物标志物和揭示神经调控机制成为当务之急。
近年来,科学家们将目光投向了一个更深层次的调控机制——翻译后修饰(Post-translational Modifications, PTMs)。这是一种在蛋白质翻译完成后,通过特定酶或化学反应进行化学修饰的过程,如同给蛋白质"化妆",改变其功能和命运。研究表明,PTMs通过调控神经炎症、血脑屏障完整性和神经元凋亡等过程,在IS病理机制中扮演关键角色。然而,PTMs与IS之间的全面关系仍不明朗,它们与免疫微环境变化的联系更需要深入探索。
正是为了解开这些谜团,来自南通大学附属医院等机构的研究团队在《Scientific Reports》上发表了最新研究成果。他们创新性地将生物信息学与机器学习相结合,从外周血转录组数据中挖掘PTM相关基因(PTMRGs),旨在为IS的诊断和治疗提供新的分子靶标。
研究人员主要运用了差异表达分析、加权基因共表达网络分析(WGCNA)、蛋白质相互作用(PPI)网络分析以及多种机器学习算法(Boruta、SVM-RFE、LASSO)来筛选关键基因。通过人工神经网络(ANN)构建诊断模型,并利用CIBERSORT进行免疫浸润分析,GeneMANIA进行基因-基因相互作用(GGI)分析,同时通过分子对接预测潜在治疗药物。临床样本来自GEO数据库的GSE16561(训练集:39例IS患者/24例对照)和GSE58294(测试集:69例IS患者/23例对照),并通过10例IS患者和10例健康对照的血液样本进行RT-qPCR验证。
差异表达分析与WGCNA模块识别
研究人员首先在训练集GSE16561中鉴定出1,465个上调基因和1,782个下调基因。通过WGCNA分析,发现棕色模块与IS呈显著正相关,而黑色、洋红色和棕褐色模块呈显著负相关。将这些模块基因与差异表达基因(DEGs)及已知PTMRGs取交集,最终获得75个关键候选基因。
功能富集分析揭示关键通路
对75个关键基因进行GO和KEGG富集分析发现,这些基因显著富集于细胞对化学应激的反应、蛋白酶体依赖的泛素介导的蛋白降解等通路,表明PTMRGs主要通过泛素化修饰和DNA修复等过程参与IS病理过程。
机器学习筛选诊断标志物
通过三种机器学习算法(Boruta、SVM-RFE、LASSO)的综合分析,研究人员最终筛选出6个诊断标志物:ATG7、KAT2A、RNF20、UBA1、UBE2I和USP15。在训练集和测试集中,这些基因的AUC值均大于0.7,显示出良好的诊断性能。
ANN模型展现卓越诊断效能
基于6个诊断基因构建的人工神经网络(ANN)模型在训练集和测试集中分别达到0.983和0.95的AUC值,显示出优异的判别能力和泛化性能,为IS的智能诊断提供了有力工具。
免疫浸润分析揭示微环境特征
研究发现IS患者与健康对照在CD8+T细胞、活化CD4+T细胞、M0巨噬细胞和中性粒细胞等免疫细胞浸润方面存在显著差异。诊断基因与这些免疫细胞表现出显著相关性,提示PTMRGs可能通过调节免疫微环境参与IS病理过程。
基因集富集分析揭示分子机制
GSEA分析显示,6个诊断基因显著富集于DNA修复、E2F靶基因、MYC信号通路等关键通路。其中ATG7、RNF20和USP15均富集于DNA修复和MYC通路,UBA1富集于E2F靶基因和上皮-间质转化通路,而UBE2I则主要富集于脂肪生成和糖酵解通路。
药物预测与分子对接
通过药物基因相互作用数据库(DGIdb)筛选出282种潜在相互作用药物,其中二十碳四炔酸(ETYA)与UBE2I和KAT2A的结合能分别为-5.6和-7,表明ETYA可能与这两个靶点存在相互作用,具有治疗IS的潜在价值。
临床样本验证
通过10例IS患者和10例健康对照的RT-qPCR验证,证实ATG7、RNF20、UBA1和USP15在IS组中显著上调,而KAT2A和UBE2I显著下调,与生物信息学分析结果一致。
这项研究首次系统性地鉴定了外周血中与IS相关的PTM相关生物标志物,不仅为IS的早期诊断提供了新的分子工具,还为理解IS的分子机制开辟了新视角。6个诊断基因及其构建的ANN模型展现出优异的诊断性能,而发现的潜在治疗药物ETYA为IS的靶向治疗提供了新思路。尽管研究存在样本来源、分子机制验证等局限,但其整合多组学数据与机器学习的方法策略,为复杂疾病的生物标志物发现提供了可借鉴的研究范式。未来通过更大规模的多中心队列验证和功能实验深入研究,这些发现有望转化为临床应用的诊断工具和治疗靶点,最终改善IS患者的预后。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号