基于机器学习和生物信息学分析的非酒精性脂肪肝病棕榈酰化生物标志物鉴定研究

【字体: 时间:2025年08月03日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对非酒精性脂肪肝病(NAFLD)诊断标志物匮乏的临床难题,通过整合WGCNA共表达网络分析与七种机器学习模型,首次系统鉴定了TYMS、WNT5A和ZFP36三个棕榈酰化相关关键基因,构建的列线图模型AUC达0.976,为NAFLD的早期诊断和靶向治疗提供了新思路。

  

在全球肥胖率持续攀升的背景下,非酒精性脂肪肝病(NAFLD)已成为威胁人类健康的"沉默杀手"。这种疾病从单纯的肝脏脂肪变性发展为非酒精性脂肪性肝炎(NASH)后,约20%患者会在3-4年内进展为肝硬化,最终可能需要进行肝移植。然而,NAFLD的发病机制复杂多变,目前临床仍缺乏可靠的早期诊断标志物。更令人担忧的是,随着代谢综合征的流行,预计到2030年NAFLD将成为肝移植的首要病因。面对这一严峻形势,寻找新型生物标志物和干预靶点成为当务之急。

棕榈酰化作为一种可逆的蛋白质翻译后修饰,通过将棕榈酸共价连接到半胱氨酸残基上,调控着蛋白质的膜定位、信号转导和代谢过程。近年研究发现,这种修饰在Toll样受体4(TLR4)和线粒体蛋白等功能调控中扮演关键角色,与NAFLD相关的脂代谢紊乱和炎症反应密切相关。然而,棕榈酰化相关基因(PRGs)在NAFLD中的系统性研究仍属空白,其作为诊断标志物或治疗靶点的潜力亟待挖掘。

西南医科大学附属医院消化内科的研究团队创新性地将生物信息学与机器学习相结合,对来自GEO数据库的人类肝脏组织转录组数据进行了深入挖掘。研究人员首先通过加权基因共表达网络分析(WGCNA)和差异表达分析筛选出60个棕榈酰化相关差异表达基因(PR-DEGs),随后应用包括神经网络(NNET)和决策树(DT)在内的七种机器学习算法,最终锁定TYMS、WNT5A和ZFP36三个关键基因。这项突破性研究成果发表在《Scientific Reports》期刊上,为NAFLD的精准诊疗提供了新视角。

研究采用的主要技术方法包括:从GEO数据库获取GSE89632(63例)和GSE164760(80例)两个队列的肝脏组织微阵列数据;通过WGCNA构建共表达网络识别疾病相关模块;利用limma包进行差异表达分析;采用7种机器学习模型筛选关键基因;通过CIBERSORT算法进行免疫浸润分析;结合单细胞RNA测序数据(GSE136103)解析细胞类型特异性表达特征。

Identification of palmitoylated biomarkers in non-alcoholic fatty liver disease via integrated bioinformatics analysis and machine learning

研究团队通过WGCNA分析发现,棕色模块与NAFLD的关联最为显著(相关系数=-0.87)。差异表达分析共鉴定出872个DEGs,与棕榈酰化基因集取交集后获得60个PR-DEGs。这些基因在TNF信号通路、脂质代谢和动脉粥样硬化等通路中显著富集,提示棕榈酰化修饰可能通过调控炎症和代谢过程参与NAFLD发生发展。

Implementation of WGCNA and identification of key module genes

Identification and functional enrichment analysis of palmitoylation-related DEGs in NAFLD

在机器学习模型比较中,NNET和DT模型表现出最优异的诊断性能(AUC分别为0.987和0.955)。通过特征重要性排序和模型交叉验证,最终确定TYMS、WNT5A和ZFP36为最具诊断价值的hub基因。值得注意的是,TYMS和WNT5A在NAFLD患者中显著上调,而ZFP36则明显下调,三者的ROC曲线下面积(AUC)均超过0.90,显示出优异的诊断潜力。

Identification of PRHGs for NAFLD via machine learning

Gene expression analysis and construction and validation of the nomogram

研究人员构建的包含这三个基因的列线图模型在训练队列中AUC达到0.976,在独立验证队列中仍保持0.903的高准确率。校准曲线显示预测概率与实际观察值高度一致(C-index=0.976),表明该模型具有可靠的临床应用价值。

GSEA and GSVA pathway analyses reveal molecular mechanisms of PRHGs in NAFLD

功能富集分析揭示,TYMS高表达与5-羟色胺代谢和JAK-STAT信号通路激活相关;WNT5A主要调控KEAP1-NRF2通路和糖异生过程;而ZFP36则通过TLR7/8/9-IRF5信号通路参与炎症调控。这些发现从分子层面阐释了hub基因影响NAFLD进展的可能机制。

The single-cell characteristics of PRHGs

单细胞转录组分析显示,TYMS主要在NK细胞中高表达,WNT5A富集于肝细胞和单核细胞,而ZFP36则在各类免疫细胞中广泛分布。CellChat分析发现,高PRHGs评分组的细胞间通讯主要通过MIF、APP和胶原蛋白信号通路进行,这些变化可能与肝脏炎症、纤维化和免疫调节密切相关。

Analysis of immune cell infiltration

免疫浸润分析显示,NAFLD患者的单核细胞、活化树突状细胞和中性粒细胞显著增加,而M2型巨噬细胞等静息态免疫细胞减少。特别值得注意的是,WNT5A与单核细胞浸润呈强正相关(r=0.72),提示其可能通过招募单核细胞加剧肝脏炎症反应。

Network for TFs-genes and genes-miRNAs with three hub genes

调控网络分析发现,hsa-let-7b-5p可能同时调控三个hub基因的表达,这为理解NAFLD的表观遗传调控机制提供了新线索。药物筛选则鉴定出曲格列酮、叶酸和骨化三醇等10种潜在治疗化合物,为后续靶向治疗开发指明了方向。

这项研究首次系统鉴定了NAFLD中棕榈酰化相关的分子标志物,不仅构建了高精度的诊断模型,还深入揭示了TYMS、WNT5A和ZFP36通过调控免疫代谢网络参与疾病进展的分子机制。特别值得关注的是,研究发现WNT5A可能通过激活KEAP1-NRF2通路和促进单核细胞浸润双重作用加剧NAFLD发展,而ZFP36的缺失则可能导致炎症抑制功能受损。这些发现为理解NAFLD的异质性和开发个体化治疗策略提供了重要理论依据。

从转化医学角度看,该研究构建的诊断模型仅需检测三个基因的表达水平即可实现NAFLD的高精度识别,具有显著的临床应用前景。鉴定出的hsa-let-7b-5p调控轴和潜在治疗药物如曲格列酮等,则为开发新型靶向疗法提供了候选靶点。未来研究可进一步验证这些hub基因的棕榈酰化修饰位点及其功能影响,探索基于基因表达的个体化治疗策略,推动NAFLD诊疗进入精准医学时代。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号