整合机器学习与基因表达谱:探寻肌萎缩侧索硬化症(ALS)新生物标志物与潜在治疗靶点
【字体:
大
中
小
】
时间:2025年05月01日
来源:Journal of Molecular Neuroscience 2.8
编辑推荐:
肌萎缩侧索硬化症(ALS)的早期诊疗困难重重。研究人员利用生物信息学和机器学习方法分析 6 个数据集,鉴定出 206 个差异表达基因(DEGs)及 3 个关键基因。这一成果有助于 ALS 的诊断与治疗,意义重大。
肌萎缩侧索硬化症(Amyotrophic Lateral Sclerosis,ALS)是一种渐进性神经退行性疾病,多种因素致使其分子发病机制难以理解,早期诊断和治疗也难以确定。探寻 ALS 中具有诊断和治疗潜力的新型生物标志物变得至关重要。因此,生物信息学和机器学习算法在识别差异表达基因(Differentially Expressed Genes,DEGs)、潜在生物标志物,以及理解 ALS 等疾病的分子机制和复杂性方面大有用处。为实现本研究目的,研究人员利用从基因表达综合数据库(Gene Expression Omnibus,GEO)获取的 6 个数据集,采用综合生物信息学和机器学习方法进行分析。在数据预处理阶段进行对数转换、RMA(Robust Multi-array Average)归一化处理,并校正批次效应。差异表达分析鉴定出 206 个与肌肉功能、能量代谢和线粒体膜活性等不同生物学过程显著相关的 DEGs。功能富集分析突出了与朊病毒病、帕金森病以及通过化学渗透偶联进行 ATP 合成等相关的通路。研究人员采用包含随机森林、LASSO(Least Absolute Shrinkage and Selection Operator)回归和支持向量机递归特征消除(Support Vector Machine-Recursive Feature Elimination,SVM-RFE)的多步骤机器学习框架来识别可靠的生物标志物。该方法确定了 3 个关键基因,即 CHRNA1、DLG5 和 PLA2G4C,经过进一步验证,这些基因有望成为 ALS 的生物标志物。包括主成分分析(Principal Component Analysis,PCA)和受试者工作特征曲线下面积(Receiver Operating Characteristic-Area Under Curve,ROC-AUC)分析在内的内部验证,证明了这些核心基因具有强大的诊断潜力,AUC 达到 0.96。这项工作凸显了生物信息学和机器学习在识别关键基因作为 ALS 诊断和治疗潜在生物标志物方面的效用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号