整合机器学习与基因表达谱:探寻肌萎缩侧索硬化症(ALS)新生物标志物与潜在治疗靶点

【字体: 时间:2025年05月01日 来源:Journal of Molecular Neuroscience 2.8

编辑推荐:

  肌萎缩侧索硬化症(ALS)的早期诊疗困难重重。研究人员利用生物信息学和机器学习方法分析 6 个数据集,鉴定出 206 个差异表达基因(DEGs)及 3 个关键基因。这一成果有助于 ALS 的诊断与治疗,意义重大。

  肌萎缩侧索硬化症(Amyotrophic Lateral Sclerosis,ALS)是一种渐进性神经退行性疾病,多种因素致使其分子发病机制难以理解,早期诊断和治疗也难以确定。探寻 ALS 中具有诊断和治疗潜力的新型生物标志物变得至关重要。因此,生物信息学和机器学习算法在识别差异表达基因(Differentially Expressed Genes,DEGs)、潜在生物标志物,以及理解 ALS 等疾病的分子机制和复杂性方面大有用处。为实现本研究目的,研究人员利用从基因表达综合数据库(Gene Expression Omnibus,GEO)获取的 6 个数据集,采用综合生物信息学和机器学习方法进行分析。在数据预处理阶段进行对数转换、RMA(Robust Multi-array Average)归一化处理,并校正批次效应。差异表达分析鉴定出 206 个与肌肉功能、能量代谢和线粒体膜活性等不同生物学过程显著相关的 DEGs。功能富集分析突出了与朊病毒病、帕金森病以及通过化学渗透偶联进行 ATP 合成等相关的通路。研究人员采用包含随机森林、LASSO(Least Absolute Shrinkage and Selection Operator)回归和支持向量机递归特征消除(Support Vector Machine-Recursive Feature Elimination,SVM-RFE)的多步骤机器学习框架来识别可靠的生物标志物。该方法确定了 3 个关键基因,即 CHRNA1、DLG5 和 PLA2G4C,经过进一步验证,这些基因有望成为 ALS 的生物标志物。包括主成分分析(Principal Component Analysis,PCA)和受试者工作特征曲线下面积(Receiver Operating Characteristic-Area Under Curve,ROC-AUC)分析在内的内部验证,证明了这些核心基因具有强大的诊断潜力,AUC 达到 0.96。这项工作凸显了生物信息学和机器学习在识别关键基因作为 ALS 诊断和治疗潜在生物标志物方面的效用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号