编辑推荐:
本文聚焦神经祖细胞(NPC)分化过程,通过实验揭示染色质可及性(ChrAcc)和 DNA 甲基化(DNAme)在不同时间尺度上协作调控增强子。研究发现二者变化存在时间差异,5 - 羟甲基胞嘧啶(5-hmC)对去甲基化有重要作用,还能用机器学习模型预测 ChrAcc 变化。
研究背景
正常细胞分化依赖于谱系特异性基因增强子的协调调控,染色质和 DNA 的修饰在这一过程中发挥着关键作用。传统观点认为,染色质重塑和 DNA 去甲基化是基因转录的必要条件,但近年来的研究对此提出了挑战。已有研究发现,DNAme 和染色质动力学之间的联系并不紧密,而且在一些细胞中,转录活性的变化可以先于或不依赖于增强子的 DNA 去甲基化。此外,DNAme 动态变化可能取决于细胞类型、去甲基化机制和时间特性。然而,目前对于 DNAme 与 ChrAcc、转录之间的关系仍存在矛盾的理解,且缺乏对混合或 “不一致” 表观遗传状态的时间分辨率研究,尤其是在命运决定增强子经历表观遗传转变时。因此,明确 DNAme 变化相对于转录因子(TF)结合、ChrAcc 和转录的时间和顺序,对于理解 DNAme、基因调控和细胞分化之间的因果关系至关重要。
实验设计
研究人员利用成熟的双 SMAD 抑制协议,将人类胚胎干细胞(HESCs)诱导分化为 NPCs。在 12 天的分化过程中,设置 9 个时间点进行样本采集,包括 0 h、6 h、12 h、24 h、48 h、3 天、4.5 天、6 天和 12 天。对每个时间点的样本,同时进行转座酶可及染色质与亚硫酸氢盐测序(ATAC-Me)和批量 RNA 测序,部分时间点还进行单细胞 RNA 测序(RNA-seq)。通过这些实验,研究人员能够在高时空分辨率下量化 ChrAcc、DNAme 和 TF 足迹之间的关系,构建它们在 NPC 分化过程中的动态变化时间线。
实验结果
- HESCs 向 NPCs 分化过程中的 DNA 去甲基化:通过 ATAC-Me 和 RNA-seq 实验,研究人员发现,在 NPC 诱导后的动态 ChrAcc 区域内存在广泛的 DNAme 变化。在总共 101,215 个可及位点中,38,189 个显示出动态可及性趋势,这些动态区域主要位于内含子和基因间区域,而启动子区域的可及性相对稳定。与终末分化的造血细胞数据不同,在该模型系统中,动态 ChrAcc 区域内捕获到大量 DNAme 变化,且 ChrAcc 变化是双向的,而 DNAme 变化大多是单向的,多数早期低甲基化区域即使染色质关闭仍保持低甲基化,大多数开放位点失去而非获得 DNAme。
- ChrAcc 的无监督聚类分析:对 38,189 个动态区域进行无监督聚类分析,根据归一化读数计数确定了 7 个聚类,这些聚类可分为 “开放”“关闭” 和 “瞬时” 三大类。不同聚类与特定的时间点相关,反映出染色质对分化信号的快速和瞬时响应。每个动态可及性聚类都与特定的基因本体相关,例如早期事件与循环系统发育的负调控有关,瞬时事件与神经元分化有关,晚期事件与前脑和大脑皮层发育有关。此外,动态区域与 18-state chromHMM 注释的增强子和抑制子状态注释有大量重叠,且在分化过程中,不同区域的染色质状态会发生显著转换。同时,通过基序富集分析发现,不同的 TF 基序与特定的可及性聚类相关,例如 OCT4/SOX2/NANOG 在关闭区域富集,PAX6 在晚期开放区域富集。
- DNAme 动态与 ChrAcc 的时间差异:量化每个可及性组内区域的总 DNAme 发现,染色质和转录变化在诱导后 6 h 就开始,而显著的 DNAme 变化直到 48 h 才出现。在动态可及性区域中,许多区域的 DNAme 变化与 ChrAcc 变化 “一致”,即 DNAme 减少伴随 ChrAcc 增加,但 DNAme 损失的最大幅度发生在 2 - 6 天,这导致一些区域在基因调控激活期间处于 “不一致” 状态,即开放且甲基化。此外,DNAme 的增加较少见,即使染色质关闭,一些区域仍继续去甲基化,形成另一种 “不一致” 的表观遗传状态,即不可及且低甲基化。通过全基因组 6 碱基测序验证,发现 DNAme 测量结果与 ATAC-Me 数据高度相关,进一步证实了这些结论。同时,基因表达变化与 ChrAcc 的相关性比与 DNAme 更紧密,表明 DNAme 与 ChrAcc 和基因表达变化存在解耦现象。
- 增强子去甲基化与 TF 结合的关系:利用 ATAC-Me 文库中的 Tn5 切割位点频率进行 TF 足迹分析,以估计动态可及性区域的 TF 占用情况。结果发现,TF 结合位点通常是低甲基化且可及的,但 30% 的可及区域在 12 天的时间内会发生 TF 结合和 DNAme 水平的转变。对于失去 TF 结合的位点,低甲基化状态在结合位点丢失后仍长期维持;而对于获得 TF 结合位点的区域,DNAme 的损失似乎在 TF 结合之前或同时开始,并在结合事件后继续减少。这表明去甲基化活动在可检测到的 TF 结合之前就开始,并且在检测到 TF 足迹后才完成去甲基化过程。
- 5-hmC 在增强子去甲基化中的作用:在 NPC 分化过程中,TET1 和 TET3 在整个时间过程中高表达,TET2 及其辅因子 IDAX 在 48 h 左右显著上调,与大量去甲基化的开始时间一致。同时,全局 5-hmC 水平在分化过程中显著增加,在 4.5 天达到峰值,然后在 12 天降至接近基线水平。通过实验发现,5-hmC 水平在细胞周期的 G2 期最高,且与 DNA 含量密切相关,表明存在连续的主动去甲基化机制将 5-hmC 转化为胞嘧啶。对动态可及性区域的 5-hmC 进行核苷酸分辨率的量化分析发现,5-hmC 的增减与可及性变化密切相关,且在去甲基化之前 5-hmC 水平会增加,之后随着去甲基化过程的进行而降低。此外,5-hmC 高的区域在动态可及性聚类中富集,并且特定的 TF 在这些区域中富集。通过对含有 BHLHA15 根基序的动态区域分析发现,在 TF 结合之前,5-hmC 就开始积累,这表明 5-hmC 可能预测关键增强子的可及性变化和 TF 结合。
- 基于 DNAme 状态预测 ChrAcc 模式:研究人员开发了一种机器学习方法,利用 XGBoost 分别对 5-mC、5-hmC 和 5-mC + 5-hmC 进行训练,以预测过去、现在和未来的 ChrAcc。结果发现,训练和测试于非定向 ChrAcc 区域的模型表现更好,这可能与非定向区域中富含 CpG 密集的启动子区域和其他 CpG 岛,其稳定的甲基化状态能高度预测稳定的 ChrAcc 状态有关。对于动态区域,训练于 4 天甲基化数据的模型在预测 ChrAcc 程度时表现最佳,其中 5-mC 和 5-hmC 对模型的贡献不同,5-hmC 在后期时间点对模型的贡献更大。这表明考虑时间和 DNAme 状态的组合对于理解 DNAme 与 ChrAcc 之间的关系以及它们在调控转录中的联合作用至关重要。
研究讨论
- 研究结果对传统观点的挑战:本研究结果挑战了教科书上关于 DNAme 在基因调控中作用的模型。以往研究发现,在终末细胞分化过程中,尽管有强烈的 ChrAcc 和转录变化,但增强子去甲基化却很少;同时,稳态 ChrAcc 和 DNAme 数据显示,可及的增强子可以处于无核小体状态,且 DNAme 水平多样,包括高甲基化。这些现象表明,DNAme 与 ChrAcc 和转录之间的关系并非如传统认为的那样紧密。本研究通过对增殖性 NPCs 的长时间研究,发现 DNAme 变化与 ChrAcc 和转录的解耦现象仍然存在,说明这种不一致性并非由细胞的增殖或发育状态导致。
- 5-hmC 在去甲基化过程中的作用机制:过去的研究未区分 5-mC 和 5-hmC,无法精确确定去甲基化相对于 ChrAcc 的起始和完成时间。本研究利用密集采样的 ATAC-Me 数据和 6 碱基测序,发现随着增强子经历 ChrAcc 和 TF 结合的波动,5-hmC 在过程早期出现,但在后期才被完全转化。这种时间上的分离导致了单个时间点上的不一致表观遗传状态。结构研究表明,TET1/2 对 5-mC 的催化效率高于 5-hmC,这可能解释了为什么维生素 C 处理能增加有丝分裂和无丝分裂细胞中的 DNAme 损失,因为它可能加速了氧化的 5-mC 底物的转化。此外,5-hmC 可能具有除作为甲基中间体外的其他功能,例如其积累可能预测增强子的可及性变化和 TF 结合。
- TF 结合与去甲基化的关系:虽然许多 TF 被认为对 DNAme 不敏感,但它们的结合位点最终显示出低 DNAme 水平。本研究发现,在预测的 TF 结合事件之前,甲基化就开始丢失,并且 5-hmC 在局部积累,随后逐渐减少。这表明去甲基化至少与 TF 结合同时开始,并且 TF 可能结合这些羟甲基化位点,促进去甲基化的完成,同时激活相关基因的转录。
- 去甲基化的机制和维持低甲基化状态的原因:在增殖细胞中,增强子去甲基化可能通过 TET 介导的主动机制和复制介导的被动机制共同实现。本研究发现,在 12 天的 9 个时间点中,存在一个特定的窗口,在此期间 DNAme 损失最大,这与 TET2 表达增加和 5-hmC 水平峰值相吻合。同时,5-hmC 水平与 DNA 含量相关,表明其不是通过被动稀释来转化,而是通过连续的主动去甲基化机制转化为胞嘧啶,但具体的转化机制尚不能确定。此外,除了失去 DNAme,很少有 ChrAcc 区域获得甲基化,这种主要的甲基化损失在开放和关闭区域都持续存在。对于停用的增强子,其长期低甲基化状态的维持机制尚不清楚,可能与能够结合核小体 DNA 的抑制性 TF、排除甲基转移酶或两者都有关。
- 研究的局限性和未来研究方向:本研究使用的 ATAC-Me 技术目前无法区分 5-mC 和 5-hmC,未来开发将 ATAC-seq 与 6 碱基测序相结合的协议,将能够更直接地分析 5-hmC 动态变化与 ChrAcc 变化之间的时间关系。此外,本研究依赖 Tn5 切割位点频率间接确定 TF 结合动力学,这依赖于 ATAC-Me 测序深度,且一些 TF 可以结合核小体 DNA,这在本研究数据中无法捕获。未来研究可以通过基于 ChIP 的方法直接探测 TF 结合,并结合 DNAme 定量,以更好地理解 TF 结合与 DNAme 状态之间的时间关系。
本研究通过对 NPC 分化过程中 ChrAcc 和 DNAme 动态变化的深入研究,揭示了它们在不同时间尺度上对增强子的调控作用,为理解细胞命运决定过程中的表观遗传调控机制提供了重要依据。