编辑推荐:
为解决 GWAS 遗传位点功能解读难题,曼彻斯特大学的研究人员开展了原发性 T 细胞染色质构象等研究,明确了相关机制,为疾病研究和治疗提供新方向。
一、研究背景
在生命科学的微观世界里,基因就像一本本神秘的 “生命指南”,掌控着人体的各种生理过程。全基因组关联研究(GWAS)就像一把神奇的钥匙,帮助科学家们找到了许多疾病背后的遗传线索,比如银屑病关节炎(PsA)和类风湿关节炎(RA)等自身免疫病。然而,这把钥匙虽然打开了遗传宝库的大门,却也带来了新的难题。大部分 GWAS 发现的遗传位点并不直接影响基因的编码序列,而是作用于基因的调控区域。这就好比找到了宝藏地图上的标记点,却不知道这些点如何引导我们找到真正的宝藏,因为调控区域影响基因表达的机制十分复杂,而且具有细胞类型特异性,这使得解读这些遗传位点的功能变得异常困难。
以往的研究试图利用各种功能基因组学技术来揭开这个谜团,比如通过表观基因组标记、eQTL 方法等确定因果变异和候选靶基因。但这些研究大多存在局限性,要么使用细胞系或健康受试者的样本,要么样本量较小,而且很多研究使用的捕获技术只能观察到局部的染色质结构,无法全面了解全局。更重要的是,基因调控和染色质构象在不同的细胞状态下差异很大,细胞系并不能完全代表原发性细胞的真实情况。因此,为了更深入地理解 GWAS 遗传位点的功能,迫切需要在原发性细胞中进行大规模、高分辨率的研究。
二、研究概况
为了攻克这些难题,曼彻斯特大学的研究人员挺身而出,开展了一项极具意义的研究。他们以 PsA 为研究对象,从 55 名 PsA 患者和 19 名健康对照者的外周血及部分患者的滑膜液中,分离出原发性 CD4?和 CD8? T 细胞,对这些细胞的染色质构象、染色质可及性和基因表达进行了全面分析。该研究成果为理解自身免疫病的发病机制提供了新的视角,也为开发潜在的治疗靶点奠定了基础,相关论文发表在学术期刊上。
研究人员主要运用了 Hi-C 技术、RNA 测序(RNA-seq)、转座酶可及染色质测序(ATAC-seq)以及多种数据分析方法。其中,Hi-C 技术用于绘制染色质构象图谱,RNA-seq 用于分析基因表达情况,ATAC-seq 则用于检测染色质可及性。通过这些技术的联合应用,研究人员得以从多个层面深入探究基因调控的奥秘。
三、研究结果
- 原发性 T 细胞功能基因组学数据集:研究人员成功构建了迄今为止最大的原发性 CD4?和 CD8? T 细胞功能基因组学数据集,包括 108 个 Hi-C 文库(490 亿读数)、128 个 RNA-seq 文库和 126 个 ATAC-seq 文库。通过统一流形近似和投影(UMAP)分析发现,样本能根据细胞类型清晰区分,且 Hi-C 重复样本间的欧氏距离明显小于患者间的距离,表明实验方法可靠。此外,研究人员还发现约 95% 的拓扑相关结构域(TAD)边界在细胞系和原发性细胞中保守,但 TAD 的紧凑度存在显著差异,细胞系与原发性细胞相比,高达 20% 的染色质环存在差异相互作用,这些差异区域涉及 T 细胞功能重要基因和疾病相关的 GWAS 位点。
- 染色质构象与基因调控密切相关:研究发现,CD8?和 CD4? T 细胞之间有 29454 个染色质环存在差异相互作用,113350 个绝缘分数箱中有 41614 个箱的紧凑度存在差异;CD8? T 细胞在血液和滑膜液中的 15597 个染色质环存在差异相互作用,30408 个箱的紧凑度存在差异。虽然疾病状态相关的基因表达差异未导致明显的染色质环或绝缘差异,但研究人员通过整合染色质可及性分析发现,差异可及峰与基因表达簇相关,且差异表达基因与差异可及峰之间的相互作用更显著。进一步研究发现,染色质结构域的绝缘分数与基因表达呈强正相关,染色质环强度与基因表达也存在关联,尤其是当环的锚定区域与基因启动子重叠时。此外,染色质可及性区域即使不直接与环锚定区域重叠,也与染色质环存在显著正相关,这表明染色质构象在转录调控中起着重要作用。
- 遗传变异与基因表达、染色质状态相关:研究人员通过实施绝缘分数 QTL(insQTL)、环强度 QTL(loopQTL)、染色质可及性 QTL(caQTL)和 eQTL 分析,评估了常见遗传变异对基因表达、染色质可及性和染色质构象的影响。结果发现,不同细胞类型之间的 QTL 具有高度一致性,约 75 - 85% 在一种细胞类型中显著的 QTL 在另一种细胞类型中至少有未校正的 p 值小于 0.01,且方向基本一致。不同模态的 QTL 之间也存在一定的重叠,例如约 38% 的 eQTL 可从与 eQTL 基因启动子重叠的 caQTL 中恢复,eQTL 与 insQTL、caQTL 与 insQTL 之间的重叠和一致性水平相似。当考虑 eQTL 和 caQTL 与 loopQTL 的重叠时,直接与基因启动子或 ATAC 峰重叠的环与基因表达和峰活性的正相关性更高。此外,研究人员还通过等位基因不平衡分析发现,染色质可及性区域有 19571 个变异存在等位基因不平衡,染色质构象数据中有 1132 个环存在等位基因不平衡,且等位基因不平衡分析比 QTL 分析更敏感。
- 影响 CTCF 结合的 GWAS 变异的后果:CTCF 是染色质结构调控的关键蛋白,研究人员在等位基因不平衡环和 loopQTL 中搜索 CTCF 结合位点内的变异,发现 18% 的等位基因不平衡环、45% 的 loopQTL 和 22% 的 insQTL 至少有一个变异与 CTCF 峰重叠,但 GWAS 变异在 CTCF 峰中的富集分析未发现显著富集。不过,研究人员发现了一些具体的例子,如 RA 位点 rs4409785 的风险等位基因可创建新的 CTCF 结合位点,改变局部染色质结构,影响 SESN3 基因的表达;IKZF3/GSDMB/ORMDL3 GWAS 位点的 rs12936231 变异也会影响染色质环和基因表达,导致疾病风险增加。
- GWAS 位点通过改变增强子功能影响基因调控的机制:研究人员利用染色质可及性等位基因不平衡来精细定位 GWAS 位点,发现约三分之一的位点存在一个或多个等位基因不平衡 SNP。例如,在 KLF13 银屑病位点,rs28510484 表现出强等位基因不平衡,与 KLF13 表达增加相关;RA 位点 rs968567 的保护性等位基因可增加染色质可及性,增强相关基因的表达;RA 位点 rs13396472 的 rs13401811 变异与 BCL2L11 基因的调控有关,通过 CRISPR/Cas9 实验验证了该变异所在增强子区域对 BCL2L11 表达的调控作用。
四、研究结论与讨论
这项研究成果丰硕,不仅构建了全面的原发性 T 细胞功能基因组学数据集,还深入揭示了染色质构象与基因调控之间的复杂关系,以及遗传变异对染色质状态和基因表达的影响机制。研究人员通过多种实验和分析方法,确定了一些在自身免疫病发病机制中起关键作用的基因和调控元件,如 BCL2L11 和 SESN3,为开发针对自身免疫病的新型治疗方法提供了潜在的靶点。
然而,研究也存在一定的局限性。例如,虽然研究发现了疾病相关的遗传变异和染色质变化,但样本量仍不足以检测所有的 QTL,未来还需要更大规模的研究来进一步完善相关结论。此外,目前的研究主要基于群体水平,对于单细胞水平的异质性研究还不够深入。尽管如此,该研究为后续研究奠定了坚实的基础,为理解自身免疫病的发病机制和开发精准治疗策略提供了重要的理论依据。
总的来说,曼彻斯特大学研究人员的这项研究成果在自身免疫病研究领域具有重要意义,为解开基因调控的谜题迈出了关键一步,有望推动相关疾病治疗的发展。