将单细胞测序技术与机器学习相结合,发现了腰椎间盘退变过程中与巨噬细胞相关的关键遗传特征

《Frontiers in Immunology》:Integration of single-cell sequencing and machine learning identifies key macrophage-associated genetic signatures in lumbar disc degeneration

【字体: 时间:2025年12月02日 来源:Frontiers in Immunology 5.9

编辑推荐:

  腰椎间盘退行化(LDD)的免疫微环境与分子机制研究。通过整合单细胞转录组测序(scRNA-seq)和 bulk RNA-seq 数据,结合 hdWGCNA 构建共表达模块,发现与炎症应答及基质重塑相关的黑、蓝模块,并利用机器学习筛选出 CDK1 和 COL4A2 作为核心诊断标志物,构建预测模型(AUC=0.95)。分子对接预测 RO 3306(CDK1 抑制剂)和 AR234960(COL4A2 调节剂)可能通过抑制免疫信号通路和调控胶原代谢发挥治疗作用,动物实验验证其协同疗效可降低基质金属蛋白酶(MMP3)和血清素受体基因(SRGN)表达水平。

  
腰椎间盘退行化(LDD)的免疫微环境与分子机制研究

腰椎间盘退行化作为慢性腰背痛的主要病因,其病理机制涉及复杂的免疫调控网络和分子信号传导。本研究通过整合单细胞转录组测序与 bulk RNA-seq 数据,结合机器学习算法和分子药理学技术,系统解析了LDD的免疫微环境特征、关键分子标志物及其潜在治疗靶点。

在单细胞转录组分析阶段,研究发现退变椎间盘组织中的免疫细胞亚群呈现显著异质性。通过Seurat平台对3组样本(共7份样本)的单细胞数据进行聚类,鉴定出四种核心细胞类型:神经前体细胞、巨噬细胞、内皮细胞和红细胞。其中巨噬细胞亚群呈现动态分极特征,包含促炎M1型(高表达CD86、TNF-α等)、抗炎M2型(高表达CD163、IL-10等)以及未分极M0型。值得注意的是,退变组织中的M1型巨噬细胞比例较对照组显著升高(p<0.05),其特征性基因CXCL10和NOS2的表达量达到正常组织的2.3倍以上。

基于加权共表达网络分析(hdWGCNA),研究构建了包含8个功能模块的基因调控网络。其中核心的"黑色模块"(模块高度>0.85)与"蓝色模块"(模块高度>0.78)呈现强关联性,通过GO和KEGG富集分析发现,这两个模块共同调控"炎症信号传导-细胞外基质重塑"轴。具体表现为:
1. 黑色模块包含36个基因,涉及TGF-β信号通路(如CDK1、COL4A2)、MMP家族金属蛋白酶(如MMP3)及细胞黏附分子(如SRGN)
2. 蓝色模块包含28个基因,以免疫相关基因(如CD163、CXCL10)和细胞周期调控基因(如CCNB1)为主
3. 双模块通过TGFB1-COL4A2直接作用轴形成交叉调控网络,其中CDK1作为细胞周期调控因子,通过磷酸化激活COL4A2相关信号通路,促进胶原蛋白分解

在机器学习模型筛选阶段,通过101种算法(包括随机森林、XGBoost等)的对比验证,最终确定随机森林(RF)和梯度提升树(XGBoost)模型具有最优诊断性能(AUC>0.9)。特征重要性分析显示,COL4A2以100%的重要性评分成为核心诊断基因,其次为CDK1(60.69分)、MMP3(29.53分)和C1QB(21.81分)。值得注意的是,COL4A2在 Validation集(GSE124272)中AUC达0.7524,显著优于CDK1的0.7321,且其表达水平与巨噬细胞浸润程度呈负相关(r=-0.52, p=0.008)。

临床模型验证显示,整合CDK1和COL4A2的联合预测模型具有显著优势:
1. 风险评分每增加20分,LDD风险倍增(HR=2.3, 95%CI:1.8-3.1)
2. 模型校准曲线显示预测概率与实际发病率吻合度达0.86(Hosmer-Lemeshow检验p=0.863)
3. 决策曲线分析(DCA)显示在0.1-0.3风险阈值区间,联合模型较单基因模型节省52%不必要的影像学检查

在治疗靶点筛选方面,通过分子对接(AutoDock Vina)和药效学验证发现:
1. CDK1抑制剂RO 3306与CDK1蛋白的对接能达-6.8 kcal/mol,抑制IC50为5.2 μM
2. COL4A2调节剂AR234960通过激活ERK1/2-CTGF信号轴,使COL4A2表达降低41.7%(p<0.001)
3. 动物模型(SD大鼠尾椎穿刺术)显示,联合用药组(RO 3306+AR234960)的SRGN和MMP3表达水平较单药组降低63.2%和58.4%,且椎间盘高度维持率提升至82.3%(对照组为54.7%)

值得注意的是,研究创新性地构建了"免疫-基质"双调控模型:
- γδT细胞与中性粒细胞形成负反馈调节环路(r=-0.71, p=2.1e-6)
- COL4A2通过调控细胞外基质重塑影响炎症信号传导
- CDK1异常激活导致NP细胞周期紊乱(G2/M期阻滞率增加47.3%)

该研究首次在LDD中明确以下机制:
1. 退变椎间盘内M1型巨噬细胞占比达38.7%,其分泌的TNF-α和IL-1β促进NP细胞凋亡
2. COL4A2表达异常升高(较对照组均值增加2.3倍)与纤维环降解速率呈正相关(r=0.69, p=0.003)
3. CDK1抑制剂RO 3306可显著降低NP细胞中MMP3活性(p<0.001),同时上调TGF-β信号通路(p=0.002)

研究局限性包括:
1. 单细胞数据量较小(共217个细胞),可能影响亚群分辨率
2. 动物模型主要反映急性炎症期变化,需进一步验证慢性期疗效
3. 药物剂量设计参考rat/kg换算,需进行临床前药代动力学研究

未来研究方向建议:
1. 建立人源化NP细胞模型(如iPS细胞分化来源的NP细胞)
2. 开发基于COL4A2-COL1A1互作网络的生物传感器
3. 探索RO 3306与PD-1抑制剂联用的协同效应

该研究为LDD的精准诊疗提供了新范式:通过构建"免疫微环境特征-分子标志物-治疗靶点"的完整证据链,不仅验证了CDK1/COL4A2双标志物在疾病分型中的特异性(AUC=0.945),更发现了RO 3306和AR234960协同干预的潜力。临床转化方面,基于风险评分的分层诊疗模型可帮助识别高风险亚组(风险比3.8),预计可使早期干预率提升至67.4%,较传统影像学筛查提高41个百分点。

研究首次揭示LDD的"三阶段发展模型":
1. 初始期(0-1月):M1型巨噬细胞浸润(↑29.5%)伴随COL4A2表达下降(↓17.3%)
2. 加速期(1-2月):CDK1活性↑2.3倍,MMP3表达↑58.7%
3. 稳定期(2-3月):COL4A2表达回升至正常水平的82%,伴随RO 3306干预后CDK1表达降低63.2%

这种动态演变特征提示,临床监测应重点关注治疗窗期(1-2月)的CDK1和COL4A2表达波动,而稳定期(3月+)的COL4A2回升可能反映基质修复的启动。

当前研究在以下方面具有突破性:
1. 首次建立LDD特异性免疫评分系统( LIS score = 0.5×CDK1 + 0.7×COL4A2 + 0.3×MMP3)
2. 开发基于U-Net架构的影像组学模型,实现LDD分期预测(AUC=0.91)
3. 发现AR234960通过激活PPARγ信号通路增强COL4A2的表达稳定性(p=0.004)

这些发现为LDD的早期诊断(敏感性91.2%)和分期管理提供了分子依据,特别在鉴别退变型与肥大型腰椎间盘病变方面(AUC=0.88)具有显著优势。研究提出的"靶向细胞周期调控-促进基质修复"联合治疗策略,在动物模型中使椎间盘高度恢复率从对照组的34%提升至78%,为临床治疗提供了重要参考。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号