编辑推荐:
慢性阻塞性肺疾病(COPD)研究结果常不一致,为明确致病核心基因,研究人员整合多中心数据,经多种分析确定 13 - 基因模型,发现 TIMP4 是关键致病基因。这为 COPD 机制研究和治疗提供新方向。
慢性阻塞性肺疾病(COPD)是一种复杂且异质性的呼吸疾病,给社会带来沉重负担。目前的治疗手段主要是缓解症状和预防急性发作,无法有效阻止疾病进展。众多针对 COPD 的基因组测序研究,因研究设计、样本选择、测序技术和数据分析方法的差异,结果常常不一致,难以确定核心致病基因,这极大地限制了对 COPD 发病机制的深入理解和新治疗靶点的开发。
为了攻克这些难题,广州医科大学附属第一医院、广州国家实验室等机构的研究人员开展了一项深入研究。他们整合了多个中心的 COPD 患者肺组织测序数据,运用多种先进技术,最终确定了 TIMP4(组织金属蛋白酶抑制剂 4)是 COPD 的潜在关键致病基因,并构建了一个 13 - 基因模型用于在分子水平区分 COPD。该研究成果发表在《Respiratory Research》上,为 COPD 的研究和治疗开辟了新的道路。
研究人员采用了多种关键技术方法。首先,整合来自不同中心的肺组织测序数据,包括 GSE47460、GSE76925 等多个数据集。然后,运用加权基因共表达网络分析(WGCNA)和多种机器学习算法,如支持向量机递归特征消除(SVM - RFE)、最小绝对收缩和选择算子(LASSO)模型等,筛选关键基因。此外,利用孟德尔随机化(MR)分析确定基因与 COPD 的因果关系,并通过单细胞 RNA 测序(scRNA - seq)探究基因在不同细胞类型中的表达情况 。
研究结果如下:
- 确定 COPD 相关基因特征:通过对两个 COPD 患者队列(GSE47460 和 GSE76925)的肺组织测序数据进行 WGCNA 分析,发现多个基因模块与 COPD 状态、肺功能和 CT 指标相关。对差异表达基因(DEGs)进行分析,并与相关模块交叉,再经 LASSO 分析和多种机器学习算法筛选,最终确定了 13 个关键基因,包括 ANGPTL1、TIMP4 等。
- 构建并验证 13 - 基因模型:用这 13 个基因构建模型,经 20 种机器学习方法评估,Extra Trees 和 Random Forest 模型表现出色。在多个数据集上的验证表明,该模型能有效区分 COPD 和非 COPD 人群,且基因表达与肺功能和 CT 指标显著相关,验证了模型的稳定性和特异性。
- 明确基因表达模式:分析 13 个基因在人和小鼠肺细胞亚群中的表达,发现其在多种细胞类型中均有表达,且在不同细胞类型中的表达存在差异。如 TIMP4 在人和小鼠的纤毛细胞中高表达。
- 确定 TIMP4 为潜在关键基因:通过 MR 分析,在 13 个基因中确定 TIMP4 是影响 COPD 进展的潜在关键基因。TIMP4 表达与肺功能呈负相关,与 COPD 诊断呈正相关,且其表达随 COPD 的全球倡议慢性阻塞性肺疾病(GOLD)分期增加而升高。
- 探究 TIMP4 对纤毛细胞的影响:对 TIMP4 阳性和阴性纤毛细胞进行分析,发现 TIMP4 阳性纤毛细胞中 WNT 和非经典 WNT 信号通路更强。在体外实验中,过表达 TIMP4 会导致气道上皮细胞中纤毛基因表达减少,纤毛数量降低,且 TIMP4 可能通过调节 MMP9 和 β - catenin 通路影响纤毛细胞功能。
研究结论和讨论部分指出,研究人员成功构建了可识别 COPD 的 13 - 基因模型,并确定 TIMP4 是潜在致病基因。虽然目前尚未明确 TIMP4 在体内的具体功能机制,但研究结果表明它可能通过破坏 MMP / 抗蛋白酶平衡,影响气道重塑和气流受限,在 COPD 发病机制中发挥重要作用。这一发现为深入理解 COPD 的发病机制提供了新视角,TIMP4 有望成为 COPD 治疗的新靶点,未来还需进一步研究其在 COPD 进展中的具体作用和潜在机制,评估其作为生物标志物和早期治疗靶点的潜力。