编辑推荐:
代谢相关脂肪性肝病(MASLD)诊疗面临困境,缺乏可靠诊断生物标志物和有效治疗策略。研究人员通过分析 GEO 数据库数据,经多方法筛选出 5 个关键基因(UBD、STMN2、LYZ、DUSP8、GPR88)。这为 MASLD 诊断和治疗提供新思路。
在当今快节奏的生活中,人们的饮食和生活方式发生了巨大变化,代谢相关脂肪性肝病(Metabolic Associated Steatotic Liver Disease,MASLD)的患病率也在逐年攀升,如同隐藏在身体里的 “定时炸弹”,严重威胁着人们的健康。MASLD 涵盖了单纯性肝脂肪变性(Metabolic Associated Fatty Liver,MAFL)和代谢相关脂肪性肝炎(Metabolic Associated Steatohepatitis,MASH),全球约 30% 的人受其困扰。MAFL 阶段病情相对温和,但约 10 - 30% 的患者会进展到 MASH 阶段,此时肝脏会出现过度炎症浸润、肝细胞损伤死亡和纤维化沉积,更可怕的是,MASH 是肝细胞癌(Hepatocellular Carcinoma,HCC)和肝衰竭的主要诱因,然而目前美国食品药品监督管理局尚未批准针对 MASH 的治疗药物,而且 MASLD 进展的风险因素和预测生物标志物也尚不明确,这极大地阻碍了新型诊断和治疗方法的发展。
为了攻克这些难题,南通大学公共卫生学院营养与食品卫生系等机构的研究人员开展了一项意义重大的研究,相关成果发表在《Journal of Translational Medicine》上。
研究人员运用了多种关键技术方法。首先,从 Gene Expression Omnibus(GEO)数据库获取了 8 个独立的临床 MASLD 数据集,这些数据集为后续研究提供了丰富的数据基础。接着,利用 DESeq2 软件包和加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis,WGCNA)筛选出与炎症相关的基因。之后,运用支持向量机递归特征消除(Support Vector Machine-Recursive Feature Elimination,SVM-RFE)、最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator,LASSO)和随机森林(RandomForest)等机器学习技术,并结合文献回顾确定关键基因。同时,通过构建蛋白质 - 蛋白质相互作用(Protein-Protein Interaction,PPI)网络、功能富集分析、免疫浸润分析等,深入探究基因的功能和作用机制。最后,利用 MASLD 动物模型、组织学检查和转录组分析对关键基因进行验证。
研究结果如下:
- 确定候选基因:通过 WGCNA 分析确定了 3992 个基因,差异表达基因(Differentially Expressed Genes,DEGs)分析得到 56 个稳健基因,整合结果后筛选出 23 个与炎症相关的候选基因。
- 功能分析:对候选基因进行功能富集分析发现,它们在炎症和代谢途径中显著富集。在生物学过程(Biological Process,BP)类别中,与趋化因子相关活动密切相关;细胞组成(Cellular Component,CC)分析显示在一些细胞结构中显著富集;分子功能(Molecular Function,MF)方面,与多种化合物和细胞因子活动有关。京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析表明,在细胞因子 - 细胞因子受体相互作用等通路显著富集;疾病本体(Disease Ontology,DO)分析揭示其与多种炎症性疾病相关。
- 确定关键基因并构建预测模型:经 PPI 网络分析和三种机器学习算法筛选,结合文献回顾,最终确定了 5 个关键基因:UBD(也称为 FAT10)、STMN2、GPR88、LYZ 和 DUSP8。基于这些基因构建的列线图(nomograms)可预测 MASH 发生的可能性,且具有一定的诊断准确性。
- 关键基因诊断性能验证:通过受试者工作特征(Receiver Operating Characteristic,ROC)曲线评估,这 5 个关键基因在区分 MASH 和 MAFL 方面具有强大潜力,其诊断性能与传统临床标志物相当甚至更优。
- 基因集富集分析:基因集富集分析(Gene Set Enrichment Analysis,GSEA)和单样本基因集富集分析(single-sample Gene Set Enrichment Analysis,ssGSEA)发现,5 个核心基因与 MASH 和 MAFL 之间的生物学差异及多种生物学过程相关,且各基因在不同信号通路中发挥作用。
- 免疫浸润分析:免疫浸润分析表明,MASH 组与 MAFL 组相比,M1 巨噬细胞、单核细胞、活化的自然杀伤细胞(NK 细胞)和调节性 T 细胞(Tregs)浸润增加,而静止的 CD4?记忆 T 细胞减少,且关键基因与这些免疫细胞类型存在显著关联。
- TF - 基因 - 化学网络分析:预测了与关键基因相关的转录因子(Transcription Factors,TFs),并发现了一些可能与关键基因相互作用的化学物质,为潜在治疗药物的开发提供了线索。
- 数据集合并验证:合并数据集后发现,关键基因在合并数据集中仍具有稳定的表达趋势和预测性能,基于疾病分期的合并数据集效果更显著。
- 动物模型验证:建立 HFHC 饮食诱导的 MASLD 小鼠模型,结果显示模型小鼠肝脏出现炎症细胞浸润、脂肪空泡和脂质积累等症状,且关键基因的表达和相关信号通路发生改变,进一步验证了研究结果。
研究结论和讨论部分指出,该研究确定的 5 个关键基因 UBD、STMN2、LYZ、DUSP8 和 GPR88,无论是单独使用还是联合使用,都有望成为诊断 MASLD 的潜在生物标志物。然而,研究也存在一定局限性,如依赖公共数据集无法确定因果关系、缺乏统一临床元数据难以控制混杂因素、主要在小鼠模型上验证等。尽管如此,这些关键基因的发现仍为深入理解 MASLD 的病理生理学提供了新视角,为开发更有效的诊断和治疗方法奠定了基础,未来需要更多研究来进一步验证和完善这些发现。