Polycomb 抑制复合物 1 和 2 近端相互作用组的综合分析揭示其在早期胚胎发育中的动态功能

【字体: 时间:2025年03月06日 来源:Cell Reports 7.5

编辑推荐:

  本文通过研究 PRC1 和 PRC2 近端相互作用组,揭示其在胚胎发育中的作用及动态变化。

  

引言

在早期哺乳动物发育进程中,细胞谱系的特化以及细胞命运的决定,在很大程度上依赖于通过表观遗传机制对基因表达进行的调控。这种调控方式不会改变 DNA 的基础序列,却能对基因活性产生影响。Polycomb 抑制复合物 1(PRC1)和 Polycomb 抑制复合物 2(PRC2),作为多蛋白复合物,在发育过程中对细胞身份的建立和维持发挥着关键作用。一旦 PRC1 或 PRC2 出现失调,在小鼠中会导致胚胎致死,在人类中则会引发发育异常。此外,在小鼠胚胎干细胞(mESCs)中去除 PRC2,会致使细胞谱系定向分化出现缺陷,细胞身份也会发生改变。这些现象都充分表明,PRC1 和 PRC2 在早期胚胎发育的基因调控过程中,处于核心地位。
PRC2 能够与染色质紧密结合,催化组蛋白 3 上赖氨酸 27(H3K27)的单甲基化、二甲基化和三甲基化(H3K27me1/2/3),最终导致基因沉默。PRC2 的核心复合物由催化亚基 EZH1 或 EZH2,以及 EED、SUZ12 和 RBBP4/7 共同构成。此外,PRC2 还包含多个可选亚基,这些亚基进一步形成了两个不同的亚复合物:PRC2.1 和 PRC2.2。其中,PRC2.1 含有三种 Polycomb 样蛋白(PHF1、MTF2 或 PHF19)中的一种,以及 EPOP 或 PALI1;而 PRC2.2 则包含 JARID2 和 AEBP2。PRC2 的核心部分主要负责其基础的酶活性,可选亚基则能够增强 PRC2 的活性,并协助其招募到特定的靶基因上。
Polycomb 介导的基因沉默,主要由 PRC1 负责。PRC1 的 CBX 亚基能够识别 PRC2 介导的 H3K27me3,从而促进其与染色质的结合。除此之外,PRC1 还可以通过其亚基 KDM2B 或 MGA/MAX,独立于 PRC2 直接招募到 DNA 上。PRC1 的催化亚基 RNF2(RING1B)能够介导 H2AK119 的单泛素化,促使染色质压实。这种泛素化修饰会干扰 RNA 聚合酶 II 的活性,最终实现转录抑制。与 PRC2 类似,PRC1 也存在不同的亚复合物。在经典的 PRC1 中,催化亚基 RNF2 会与 CBX、PHC、SCM,以及 PCGF2(PRC1.2)或 PCGF4(PRC1.4)相互作用;在非经典的 PRC1 中,RNF2 主要与 KDM2B、BCOR、SKP1、RYBP/CBX,以及 PCGF1(PRC1.1),或者与 RYBP 和 PCGF3、PCGF5、PCGF6 中的一种蛋白相互作用,分别形成 PRC1.3、PRC1.5 和 PRC1.6。除了依赖 PRC2 的功能外,PRC1 在其他细胞类型中还具有独立调节基因的能力。不过,PRC1 和 PRC2 常常在特定的基因组位点共定位,形成 Polycomb 染色质结构域。这些结构域富含 H3K27me3、H2AK119ub1,以及这两种复合物,但它们的结构和功能仍有待深入研究。
到目前为止,大多数研究都是通过传统的亲和纯化结合质谱(MS)技术,来识别 PRC2 的直接相互作用蛋白。然而,近期的研究发现,一些非 Polycomb 蛋白在精细调节 PRC2 的活性和定位方面发挥着重要作用,例如 H3K36 组蛋白甲基转移酶 NSD1、H3K9 组蛋白甲基转移酶 G9A(EHMT2),以及 rixosome 的组成成分等。这表明,PRC2 的活性不仅受到直接与复合物结合的蛋白质的调节,还会受到那些与 PRC2 存在弱相互作用、短暂相互作用,或者通过辅助蛋白间接相互作用的蛋白质的影响。而传统的相互作用蛋白质组学方法,在捕捉这些短暂相互作用时往往存在不足,因为这些相互作用在细胞裂解或严格的洗涤步骤中很容易丢失。基于邻近标记的技术为解决这一难题提供了有效的途径。该技术通过将一种酶与目标蛋白融合,使活性分子(如生物素)能够共价连接到目标蛋白附近的蛋白质上。随后,可以利用基于链霉亲和素的亲和纯化技术分离这些标记的蛋白质,并通过质谱进行鉴定。通过将邻近标记酶与 PRC1 和 PRC2 的亚基融合,研究人员能够全面地描绘出定位在 Polycomb 染色质环境中的蛋白质,为研究 Polycomb 复合物发挥功能的完整相互作用谱提供了有力工具,有助于深入了解其动态且复杂的作用机制。

结果

  1. 利用(mini)TurboID - 基于邻近标记技术鉴定 EZH2 近端蛋白:为了剖析 PRC2 的近端蛋白质组,研究人员运用 CRISPaint 技术,将 TurboID 或 miniTurboID 融合到 R1 mESCs 中内源性Ezh2基因的 C 末端。对于每种标记,研究人员基于标签的框内整合情况,挑选出两个杂合克隆,并通过基因组 PCR 和 Sanger 测序进行验证。通过蛋白质免疫印迹实验,研究人员观察到 EZH2 的条带发生了位移,并且在添加生物素后,出现了广泛的蛋白质生物素化现象,这表明融合蛋白成功表达,并且生物素连接酶具有活性。为了便于可视化和进行染色质免疫沉淀测序(ChIP - seq),研究人员还在 miniTurboID 克隆中引入了血凝素(HA)标签。免疫荧光实验显示,标记的 EZH2 定位于细胞核内,并且发生了生物素化,与预期结果一致。此外,野生型(WT)细胞中 EZH2 的染色质结合谱,与两个表达 Ezh2 - HA - miniTurboID 的细胞系中 HA ChIP - seq 信号高度相关,这表明标签不会干扰蛋白质的基因组定位。同时,标记过程既没有改变 H3K27me3 的整体水平和定位,也没有影响富含 H3K27me3 的基因组区域,这些区域与 EZH2 的结合位点相互重叠。研究人员还发现,WT 细胞与表达 EZH2 - TurboID 的细胞之间,在整体蛋白质组或特定 PRC2 成分方面,均未出现显著变化。这些结果充分证实了 Ezh2 标记的成功,并且表明 EZH2 - (mini)TurboID 融合蛋白具有正常功能。
接下来,为了识别 mESCs 中的 EZH2 近端蛋白,研究人员进行了邻近依赖性生物素化实验,随后通过基于链霉亲和素的亲和富集和质谱分析,对来自四个 EZH2 - (mini)TurboID 克隆的核裂解物进行检测。由于 TurboID 的基础活性较高,即使在未添加生物素的情况下,培养基中的痕量生物素也会导致近端蛋白发生生物素化,因此 “无生物素” 条件不适合作为背景对照。而 miniTurboID 的基础生物素化活性较低,能够利用未添加生物素处理的样本作为对照,有效地富集 PRC2 成分。为了确保 TurboID 和 miniTurboID 表达细胞之间的一致性,研究人员使用添加生物素处理的 WT 细胞作为背景对照进行分析。最终,研究人员鉴定出 101 种在 EZH2 邻近相互作用组中显著富集的独特蛋白质(所有克隆中 log2 倍变化 [FC] > 1 相对于 WT,至少一个克隆中 log2 FC > 2,并且所有克隆中p < 0.05)。这些蛋白质构成了 PRC2 的一致性邻近相互作用组。研究人员发现,不同的 EZH2 - (mini)TurboID 克隆之间,近端相互作用蛋白具有良好的相关性,这表明所鉴定的 EZH2 相互作用蛋白与所使用的生物素连接酶类型无关。为了与传统的相互作用组进行比较分析,研究人员构建了 EZH2 - GFP 敲入克隆,并进行了 GFP 亲和纯化结合质谱分析,在此过程中鉴定出 39 种显著富集的蛋白质。EZH2 的邻近相互作用组和 GFP 相互作用组均显示出所有核心 PRC2 成分(EZH1/2、SUZ12、EED 和 RBBP4/7),以及可选亚基如 MTF2、PHF1、JARID2、AEBP2、EPOP、PALI1(GM340)和 EZHIP(AU022751)的存在。研究人员还鉴定出了已知的 PRC2 相关蛋白,如 TCEB1/2(ELOB/C)、EHMT2 和 ZNF518A。此外,研究人员在两个数据集中都发现了 PRC1 亚基 RNF2、CBX2 和 PHC1 的富集,尽管在传统的 EZH2 - GFP 亲和纯化中,它们的倍数变化较低。值得注意的是,EZH2 的邻近标记技术揭示了 12 种不同的 PRC1 成员,这充分凸显了邻近相互作用组分析在捕捉直接、间接和短暂相互作用方面的优势。与之相符的是,PRC2 的邻近相互作用组极大地扩展了 GFP 相互作用组的范围,揭示了一组先前未被认为与 PRC2 功能相关的蛋白质,这些蛋白质在 GFP 相互作用组中要么未被检测到,要么未得到富集。其中包括许多参与 mRNA 剪接的 RNA 结合蛋白(如 ISY1、PRPF3)、多种转录因子和转录调节因子(如 NANOG、SALL1 和多个锌指蛋白)。研究人员还鉴定出了几种组蛋白和染色质修饰剂(NSD1、TRIM24、SMARCA1),以及 NuA4 复合物的成员(P400、ING3)。对于其中的一些因子,如 NSD1、TET1、HDAC1、NR0B1 和 YAP,先前的研究已经通过 ChIP - seq 共定位或机制筛选,暗示了 PRC2 与它们的功能存在关联。而本研究的数据进一步表明,这些因子在体内与 EZH2 邻近,为它们之间的功能联系提供了更有力的支持。此外,PRC2 的邻近相互作用组还包括一些先前已被证实与 PRC2 存在相互作用的蛋白质,如 NANOG。值得一提的是,研究人员还鉴定出了多种细胞周期蛋白,如 HELLS、CDCA2 和 TPX2,不过这些蛋白被认为可能是基于链霉亲和素的亲和纯化实验中的潜在污染物。
报道的倍数变化是通过比较表达(mini)TurboID 融合蛋白且经生物素处理的细胞与经生物素处理的 WT 细胞的亲和富集肽强度计算得出的。而基于强度的绝对定量(iBAQ)的化学计量分析,则用于测量每个相互作用蛋白相对于亲和富集的 EZH2 的含量。较高的化学计量值表明该蛋白质可能对 PRC2 的功能具有更重要的影响。研究人员通过计算 iBAQ 值,对近端蛋白相对于 EZH2 的化学计量进行了研究。不出所料,已知的 PRC2 成分(如 SUZ12、AEBP2、MTF2)与 EZH2 相比,具有最高的相对化学计量。然而,有趣的是,研究人员还发现一些 RNA 结合蛋白和转录调节因子(NANOG、SALL1/4、TRIM24)也具有较高的化学计量,在某些情况下,这些蛋白质的化学计量甚至超过了已确定的 PRC2 相互作用蛋白。这些发现进一步揭示了体内 PRC2 局部染色质环境的复杂性,并对与 PRC2 功能相关的蛋白质类别进行了全面概述。2. 多能性相关转录因子与 PRC2 邻近:在 PRC2 的邻近相互作用组中鉴定出转录因子和转录调节因子,这一发现具有重要意义,因为在通过传统亲和纯化鉴定的 PRC2 相互作用组中,通常不会出现转录因子。为了进一步探究这一现象,研究人员对 PRC2 邻近转录调节因子在 PRC2 功能中的作用进行了研究。具体而言,研究人员基于以下几个方面的考虑,重点关注了 NANOG、SALL1/4 和 TRIM24:(1)在亲和纯化实验中,它们与 EZH2 的化学计量相对较高;(2)先前有报道表明 PRC2 与 NANOG 和 SALL1/4 存在相互作用;(3)TRIM24 具有结合 H3K4 的能力。研究人员利用 dTAG - Suz12 降解细胞系,通过邻近连接测定(PLA)技术,对它们与 EZH2 的邻近性进行了验证,并且还评估了 PRC2 扰动对这些蛋白质与 PRC2 邻近性的影响。作为对照,PLA 实验证实了 EZH2 和 SUZ12 的共定位现象,并且在使用 dTAG - 13 处理 1 小时导致 SUZ12 降解后,这种共定位现象消失,这充分证明了该检测方法的特异性。随后,研究人员对 NANOG、SALL1/4 和 TRIM24 与 EZH2 的邻近性进行了研究。细胞核 PLA 实验中的荧光焦点表明,EZH2 与所有测试的相互作用蛋白均存在共定位。此外,在 SUZ12 降解后,SALL1/4 - EZH2 的 PLA 信号明显减弱。在敲除(KO)SALL4 后,荧光焦点的数量也有所减少,这进一步证实了 SALL4 与 EZH2 的邻近性。研究人员观察到,NANOG 和 EZH2 之间的 PLA 荧光焦点数量存在很大差异,部分细胞显示出大量的荧光焦点,而另一些细胞则与阴性对照相似,仅有极少或没有荧光焦点。这种差异可能反映了在血清培养的 mESC 群体中,NANOG 的表达存在异质性。重要的是,SUZ12 的缺失对 EZH2 和测试的近端蛋白的染色质结合影响较小,因此,短期 SUZ12 缺失后观察到的 PLA 信号减弱,很可能是由于直接相互作用的丧失,而非 EZH2 或转录调节因子的染色质结合发生了变化。
随后,研究人员利用 ChIP - seq 技术,对选定的四种 PRC2 近端蛋白(NANOG、SALL1/4 和 TRIM24)的全基因组结合谱进行了研究。所有这些蛋白都与 EZH2 和 H3K27me3 修饰存在大量重叠,这进一步支持了它们与 PRC2 在特定基因组位点的共占据现象。对于 NANOG,研究人员进一步评估了 PRC2 扰动对其全基因组结合谱的影响。为了区分 PRC2 缺失本身和 H3K27me3 缺失对 NANOG 结合的影响,研究人员利用 dTAG - SUZ12 降解细胞系,进行了短期(1 小时)和长期(72 小时)的 PRC2 缺失实验。在 PRC2 缺失后,研究人员观察到,在共占据的 EZH2 和 NANOG 位点,NANOG 的结合在全基因组范围内显著减少;而在 PRC2 缺失前仅由 NANOG 结合的位点,其结合情况基本保持不变。有趣的是,研究人员还发现了一组基因组位点(n = 2,273),在 SUZ12 缺失后,NANOG 的 ChIP - seq 信号反而增强。这种增强似乎是由 SUZ12 的破坏直接导致的,而非 H3K27me3 缺失的间接影响,因为在短期和长期的 SUZ12 缺失实验中,并未观察到差异。这些获得的 NANOG 结合位点富含 NANOG 结合基序,并且主要位于远端基因间区域。值得注意的是,这些获得的 NANOG 位点附近的基因,在 EZH2 KO 细胞中并未显示出显著的差异表达,并且这些基因也没有富集的基因本体(GO)术语。综上所述,这些研究结果表明,PRC2 能够限制 NANOG 与特定基因组位点的结合。3. 亚基依赖性 PRC2 扰动导致不同的 H4 乙酰化:PRC2 的邻近相互作用组中包含多个 NuA4 复合物的成员,该复合物能够催化组蛋白 H4 的乙酰化。ING3 与 EZH2 邻近,EPC1 是已知的 PRC2 相互作用蛋白,TIP60 在本研究中略低于 EZH2 邻近性的阈值,它们共同构成了维持基础 HAT 活性所需的 piccolo NuA4 组蛋白乙酰转移酶(HAT)复合物。值得注意的是,在小鼠和人类胚胎干细胞中,H4 乙酰化与 H3K27me3 似乎呈负相关,在不同的多能状态之间,H3K27me3 的减少往往伴随着 H4 乙酰化的上调。为了从机制上研究 PRC2 和 NuA4 之间的这种关联,研究人员在对 PRC2 进行遗传或化学扰动后,检测了 H4 乙酰化的情况。在 R1 mESCs 和 E14 dTAG - Suz12 降解 mESCs 中,使用 EED 或 EZH2 抑制剂长期(4 天)抑制 PRC2,会导致 H3K27me3 减少,同时 H4ac 增加。同样,在 EED 突变体和 KO 细胞系中,研究人员也观察到 H3K27me3 减少的同时,H4 乙酰化显著上调。然而,在对 Suz12 进行扰动时,研究人员观察到了不同的 H4 乙酰化模式:敲除 Suz12 会导致 H3K27me3 减少,但不会引起 H4 乙酰化的上调。与此观察结果一致,使用 dTAG - SUZ<12 mESCs 急性耗尽 SUZ12 72 小时后,尽管 H3K27me3 减少,但 H4ac 并未上调。研究人员通过组蛋白翻译后修饰(hPTM)质谱验证了这些结果。这些结果表明,H3K27me3 和 H4Ac 之间的功能联系由 SUZ12 介导,但潜在的分子机制仍有待进一步研究。4. PRC2 近端相互作用组在发育过程中的动态变化:近期研究发现,PRC2 的组成在 mESC 谱系定向分化过程中会发生改变。在绘制了类似于植入后胚胎(约胚胎第 5.5 天)的血清培养细胞中 PRC2 的邻近相互作用组后,研究人员进一步评估了 PRC2 近端相互作用组在不同细胞状态下的动态变化。为此,研究人员将在标准血清 / 白血病抑制因子(LIF)条件下生长的 EZH2 - TurboID mESCs 转换到含有 2i 的无血清培养基(以下简称 2i)中培养,2i 培养基代表了早期植入前胚胎(约胚胎第 3.5 天)的多能性基础状态。同时,研究人员将血清培养的 mESCs 诱导分化为胚状体(EBs),EBs 包含来自所有三个胚层的细胞,代表了原肠胚形成后期阶段。研究人员对 2i 和 EB 条件下的核裂解物进行了邻近依赖性生物素化和基于链霉亲和素的亲和富集实验。虽然 2i、血清和 EB 条件下的近端相互作用组存在大量重叠,但研究人员也鉴定出了许多细胞状态特异性的 EZH2 近端蛋白。2i 条件下 PRC2 近端蛋白的富集程度似乎比血清和 EB 条件更强,但 PRC2 成分本身在 2i mESCs 中的富集程度并不如其他条件。此外,在 2i mESCs 中鉴定出的 EZH2 相互作用蛋白数量(390 个独特相互作用蛋白),远远高于血清 mESCs(101 个独特相互作用蛋白)或 EBs(142 个独特相互作用蛋白)。由于已知 PRC2 在 2i mESCs 中会在基因组上整体增加并重新分布,因此 PRC2 近端相互作用蛋白数量和富集程度的增加,可能反映了与这种重新分布相关的生物学变化。不过,技术因素也可能导致在 2i 条件下鉴定出更多的 EZH2 近端蛋白,特别是与其他条件下使用的培养基不同,用于培养 2i mESCs 的 Ndiff 227 培养基中含有可检测水平的生物素,这可能会影响实验结果。
正如预期的那样,PRC2 核心成分在所有三个发育阶段中,都是与 EZH2 相对化学计量最高的蛋白质之一。研究数据证实了一些可选 PRC2 亚基和相关蛋白质的动态变化。例如,PHF19 在 EBs 中富集且化学计量较高,这与它在分化过程中对 PRC2 功能的重要作用相符;而 TCEB1/2、AU022751(EZHIP)和 MTF2 在 EBs 中的富集程度和化学计量,相较于未分化的 mESCs 则低得多。此外,研究数据还支持了先前的观察结果,即 RBBP4/7、MTF2 和 EZH1 在 2i ESCs 中的化学计量比血清 mESCs 更高,而 EPOP 和 JARID2 在血清 mESCs 中的化学计量更高。对公开的 2i 和血清 mESCs 全蛋白质组数据的分析表明,某些蛋白质(如 JARID2)与 EZH2 相对化学计量的变化,部分可以由蛋白质丰度来解释,但这种相关性非常弱。
研究数据还表明,与 PRC2 相关的 PRC1 复合物发生了重组。虽然 RNF2 在不同发育阶段相对稳定,但其他一些 PRC1 成分(如 CBX2 和 PCGF6)的富集程度和化学计量发生了变化。值得注意的是,研究人员发现经典 PRC1 成分 PHC1 在血清条件下具有较高的化学计量,与一些 PRC2 亚基的水平相当。鉴于 PHF1 在 PRC1 之外还具有独立的功能,例如通过 NANOG 调节多能性,这一发现表明 PHC1 在血清条件下可能对 PRC2 的调节发挥潜在作用,值得进一步研究。
PRC2 近端转录调节因子 NANOG、SALL1 和 TRIM24 在所有三个发育阶段似乎都有很强的富集,但它们在 EBs 中的化学计量却显著降低。DNA 去甲基化酶 TET1 在不同发育阶段都与 PRC2 邻近,这可能反映了 H3K27me3 与 DNA 甲基化之间的拮抗关系。相反,研究人员也检测到了阶段特异性的近端蛋白。例如,HMGB1 和 HMGB2 在 2i 条件下特异性富集且化学计量较高。有趣的是,果蝇中 HMGB2 的同源物 DSP1 已知可将 Polycomb 蛋白招募到染色质上,这表明 HMGB1 和 HMGB2 可能在早期胚胎发生过程中对 PRC2 的功能发挥关键作用。对于 EB 特异性的 PRC2 近端蛋白,研究人员鉴定出了 EHMT1、ZEB2 和 GATA1。其中,EHMT1 的这一发现与先前的报道一致,即该蛋白与 PRC2 介导的 H3K27 甲基化有关。这些结果充分证明,PRC2 的邻近相互作用组在早期发育进程中是动态变化的。5. PRC1 近端相互作用组与 PRC2 部分重叠:在 PRC2 近端鉴定出大量(非)经典 PRC1 亚基,包括催化亚基 RNF2 以及其他主要的(非)经典 PRC1 亚基(如 PCGF1/6、KDM2B、CBX2、BCOR 和 PHC1),这表明 PRC2 和 PRC1 在 mESCs 中存在协同作用。接下来,研究人员旨在探究 PRC1 和 PRC2 是否也通过独立的近端蛋白发挥各自的功能。为此,研究人员构建了表达 TurboID 与 RNF2(PRC1 的核心成员之一,具有 E3 泛素连接酶活性)融合蛋白的细胞系。研究人员通过 Sanger 测序和蛋白质免疫印迹验证了两个克隆的杂合标记,观察到在添加生物素后,表达 TurboID 的细胞中出现了广泛的蛋白质生物素化,并且标记过程并未影响全局 H2AK119ub 水平,这证实了 RNF2 - TurboID 融合蛋白在两个克隆中的功能正常。
随后,研究人员对两个 RNF2 - TurboID 克隆进行了邻近依赖性生物素化、亲和富集和质谱分析,以生成 PRC1 的一致性邻近相互作用组。研究人员鉴定出 171 种显著富集的蛋白质(在两个克隆中 log2 FC > 1 相对于 WT,至少一个克隆中 log2 FC > 2,并且两个克隆中p < 0.05)。两个 RNF2 - TurboID 克隆之间显示出很强的相关性。不出所料,研究人员鉴定出了大量已知的经典和变体 PRC1 复合物成员与 RNF2 邻近,包括六种 PCGF 蛋白、CBX 蛋白和 RYBP。此外,研究人员还鉴定出了转录因子、转录调节因子、组蛋白修饰剂,以及参与 RNA 过程、DNA 损伤和 DNA 甲基化的蛋白质与 RNF2 邻近。通过比较 RNF2 - TurboID 和 EZH2 - TurboID 细胞系中的蛋白质富集情况,研究人员发现 PRC1 和 PRC2 的近端相互作用组存在显著重叠。共享的蛋白质包括大多数 PRC1 亚基、转录因子和调节因子(如 NANOG、NR0B1 和 PRDM5)、组蛋白修饰剂(HDAC1、NSD1 和 EHMT2)、DNA 去甲基化酶 TET1、各种 RNA 结合蛋白,以及 NURF 和 NuA4 复合物的成分。其中,PRDM5 和 EHMT2 已知与 HDAC1 共同作用来沉默基因,这展示了 PRC1 近端相互作用组中一个明确的功能模块。这些共享的 PRC1 和 PRC2 近端蛋白,可能有助于形成 Polycomb 染色质结构域特有的染色质环境,在这个环境中,PRC1 和 PRC2 协同抑制基因表达。
令人惊讶的是,除了 ZNF518A,研究人员在 PRC1 的邻近相互作用组中未检测到任何 PRC2(亚化学计量)亚基,这一点将在下文进一步讨论。除了 PRC2 亚基的缺失,研究人员还鉴定出了 PRC1 和 PRC2 之间的其他差异近端蛋白。这些包括 PRC2 特异性近端蛋白 TEAD4(一种转录调节因子,与 YAP1 共同调节滋养外胚层分化)、核共抑制因子 NCOR2、原始多能性转录因子 PRDM15,以及各种含锌指蛋白。这些蛋白质可能通过促进 PRC2 的特定 DNA 靶向和 / 或染色质扩散,从而将 PRC2 与转录机制和多能性网络联系起来,进而对 PRC2 的功能产生影响。有趣的是,PRC1 特异性近端蛋白的数量是 PRC2 特异性蛋白的两倍多。与 PRC2 类似,PRC1 也与多能性网络相关,这体现在多能性因子(如 SALL1、KLF4、KLF5、BRD1、BRD4、ZFP462 和 MPHOSPH8)与 PRC1 的邻近性上。值得注意的是,BRD4 先前已被证明在乳腺癌细胞中与 PRC1 修饰的活性增强子相互作用。此外,PRC1 特异性近端蛋白 REST 已被证实参与了 PRC1 不依赖于 PRC2 的靶向过程。表观遗传修饰剂(如 CDH7/8/9、KDM5A、KDM5C、HDAC1/2 和 TET2)可能在 PRC1 介导的基因沉默中发挥独立于 PRC2 的作用。最后,SALL1 与 PRC1 的邻近性,可能解释了其先前被观察到的在调节 Polycomb 体中的作用。6. PRC1 邻近相互作用组缺乏 PRC2 成分:EZH2 和 RNF2 邻近相互作用组之间最显著的区别,在于 RNF2 邻近相互作用组中 PRC2 复合物成员没有显著富集,而 EZH2 邻近相互作用组中同时包含 PRC1 和 PRC2 的亚基。为了证实这一发现,研究人员构建了额外的细胞系,分别表达 TurboID 与 PRC2 成分 SUZ12、PRC1 亚基 PCGF6 或 CBX7 的融合蛋白。对于每种蛋白质,研究人员都成功获得了纯合标记的克隆。随后,研究人员对这些细胞系进行了邻近依赖性生物素化、亲和富集和质谱分析。
对 SUZ12 邻近相互作用组的分析证实了所有 PRC2.1 和 PRC2.2 亚基的存在。与 EZH2 邻近相互作用组相比,大多数 PRC2 成分和许多其他 PRC2 近端因子(如 NANOG 和各种锌指蛋白)在两个邻近相互作用组中的富集情况相似。此外,研究人员还鉴定出了 123 种 SUZ12 特异性近端蛋白。GO 术语富集分析表明,这些蛋白质主要与高尔基体和内质网相关。这可能代表了 Suz12 在细胞质中不依赖于 PRC2 的作用,但从技术角度解释,也可能是 SUZ12 - TurboID 在合成和运输到细胞核的过程中,在细胞质中对近端蛋白进行了生物素化;或者是一部分 SUZ12 - TurboID 未正确折叠,滞留在内质网和高尔基体中,从而导致这些蛋白质的生物素化。
对 PCGF6 和 CBX7 邻近相互作用组的分析证实了 PRC1 亚基的存在,并且在 RNF2 - TurboID 细胞系中也观察到了类似的富集情况,这验证了这些融合蛋白的功能。有趣的是,PCGF6 和 CBX7 邻近相互作用组显示出不同 PRC1 亚基的富集,这反映了变体 PRC1 复合物的组成差异。例如,PCGF6 与 CBX3、RYBP、MGA、E2F6、MAX、WDR5 和 L3MBTL2 组装成非经典 PRC1 复合物,这些在 PCGF6 邻近相互作用组中富集程度更高;而 CBX7 与 PCGF2 和 PHC2 结合形成经典 PRC1 复合物。重要的是,PRC2 亚基在 PCGF6 或 CBX7 邻近相互作用组中均未显示出显著富集,这与在 RNF2 - TurboID 细胞系中的观察结果以及先前的相互作用研究一致。
鉴于 PRC1 邻近相互作用组始终缺乏 PRC2 亚基的富集,而 PRC2 邻近相互作用组包含经典和非经典 PRC1 成分,研究人员进一步分析了公开的 ChIP - seq 数据集,以评估这种模式是否也反映在 PRC1 和 PRC2 亚基的基因组结合模式中。分析结果显示,虽然大多数 PRC2 结合位点也被 PRC1 结合,但在整个基因组中,有相当数量的 PRC1 结合位点并未被 PRC2 结合。结合研究人员观察到的 RNF2 比 EZH2 更丰富的现象,这些发现表明,相当一部分 PRC1 的功能独立于 PRC2。这为干细胞生物学中这些复合物的不同作用提出了有趣的问题,也为进一步探索 Polycomb 生物学指明了潜在的研究方向。

讨论

在本研究中,研究人员在多种细胞环境中绘制了 PRC1 和 PRC2 核心亚基的近端相互作用组。以往的研究主要通过体外方法来鉴定 PRC1 和 PRC2 的直接相互作用伙伴,而本研究则首次在体内对 PRC1 和 PRC2 的直接、间接和短暂相互作用蛋白进行了全面的图谱绘制。与传统的基于抗体的亲和纯化方法不同,本研究方法鉴定出了大量与 PRC 复合物邻近的转录(共)调节因子和 RNA 结合蛋白。对于其中的一些因子,如 NSD1、HDAC1、NR0B1 和 YAP,本研究结果补充了先前的研究,进一步强调了它们在 PRC2 功能中的作用。
尽管之前有一些关于 PRC2 与转录因子直接相互作用的零散证据,但本研究提供了一份与 PRC1 和 PRC2 相关的转录因子综合清单。这些发现与近期在植物中的观察结果一致,即在植物中,转录因子可以介导 PRC2 的招募,这一现象在果蝇中也同样存在。研究人员推测,本研究中鉴定出的与 PRC1 和 PRC2 相关的转录因子,可能识别特定的 DNA 序列,有助于 Polycomb 复合物在靶启动子上的招募或稳定。研究人员还研究了相反的情况:破坏 PRC2 会导致 NANOG 结合重新分布到含有 NANOG 结合基序的位点。这表明 PRC2 可能将一部分 NANOG 隔离在特定的基因组位点。PRC2 和 H3K27me3 通常存在于二价染色质结构域中,与 H3K4me3 和其他表观遗传调节因子共存。这些结构域能够在分化过程中实现快速的转录激活或抑制。同样,研究人员提出,NANOG 与 PRC2 的邻近性发生在胚胎发育不同阶段中,为激活或抑制做好准备的基因组位点上。
虽然 RING1B 的功能主要在 PRC1 的背景下被描述,但 EZH2 已知具有独立于 PRC2 的功能,这在肿瘤中尤为明显。EZH2 还被证明可以通过与雄激素受体或 RelA 的相互作用结合染色质。然而,鉴于其他经典 PRC2 亚基与 EZH2 的化学计量较高,细胞内的大多数 EZH2 似乎都作为 PRC2 复合物的一部分发挥作用。尽管如此,本研究中鉴定出的一些与 EZH2 相关的蛋白质,尤其是那些富集程度较低的蛋白质,可能是 EZH2 独立于 PRC2 的相互作用结果。为了进一步探索这一点,可以进行相互作用研究,以明确这些单个靶蛋白是与经典 PRC2 复合物相关,还是仅与 EZH2 相关。
在哺乳动物基因抑制过程中,PRC1 和 PRC2 之间存在着众所周知的协同作用,但在 PRC2 近端蛋白质组中持续鉴定出 PRC1 成分,而在 PRC1 近端蛋白质组中却未鉴定出 PRC2 成分,这一现象有些出乎意料。不过,这与近期的研究结果一致,即 PRC2 在 Polycomb 染色质结构域的占据主要由 PRC1/H2AK119 决定,而 PRC1 介导的基因抑制可以独立于 PRC2 或 H3K27me3 发生。研究人员和其他团队也报道过,在没有 PRC2 的情况下,PRC1 可以结合在活性启动子和增强子上,这进一步支持了 PRC1 和 PRC2 生物学功能的部分解耦。未来,可以针对单个 PRC1 和 PRC2 亚复合物的近端蛋白质组进行研究,以进一步探究这些发现。
总体而言,本研究提供了不同细胞环境中 PRC2 和 PRC1 近端蛋白质的丰富资源,为阐明这些蛋白质在胚胎发育过程中如何参与 Polycomb 生物学过程提供了起点。这可能包括研究它们在 PRC1 和 PRC2 的招募、靶向和扩散中的作用,揭示它们在 Polycomb 沉默中的功能,或者研究这些蛋白质如何在细胞命运转变过程中使 PRC1 和 PRC2 重新定位。此外,这一资源还可以作为研究近端相互作用组如何依赖 PRC2 功能的基础,例如使用 PRC2 的小分子抑制剂或靶向蛋白质降解方法。最后,为了将研究结果扩展到原代细胞或组织(在这些细胞或组织中进行内源性标记具有挑战性或无法实现),研究人员预计可以采用 “现成” 的邻近生物素化方法,如使用 ProtA - Turbo 酶结合诱饵特异性抗体,来探索不同生物学和病理背景下的 Polycomb 邻近相互作用组。

研究的局限性

近年来,邻近标记方法在探测体内感兴趣诱饵的近端相互作用组方面已被证明非常有用。然而,这些检测方法常常面临识别低丰度但生理相关的诱饵近端蛋白的挑战,因为其信噪比往往较高。理想情况下,研究人员希望为协同调节基因表达的蛋白质生成高度富集的相互作用组。例如,研究 PRC1 和 PRC2 的共享近端蛋白质组,将有助于获得 Polycomb 抑制<染色质的高分辨率蛋白质组,而目前使用针对 prc1 和 prc2 的单亲和纯化方法无法实现这一目标。最近开发的串联邻近标记方法可能有助于解决这一问题。通过研究 prc1 和 prc2 独特和共享的近端蛋白质,最终可能识别出参与这些复合物从头招募到染色质的因子,以及参与 prc1 和 prc2>
最后,尽管本研究清楚地展示了邻近标记方法在解读感兴趣蛋白质生物学功能方面的价值,但也凸显了揭示某些诱饵近端相互作用生物学后果的挑战。例如,研究人员鉴定出许多与 PRC1 和 PRC2 邻近的剪接相关蛋白,但尚未阐明它们的功能意义。展望未来,邻近生物素化研究可以与具有特定功能读数的靶向 CRISPR 筛选相结合,以便为机制研究优先选择诱饵近端靶点。此外,超分辨率显微镜结合计算机预测的蛋白质 - 蛋白质相互作用模型,可能为确定已鉴定的近端蛋白质如何促进 PRC 功能提供有价值的见解。

资源可用性

  1. 主要联系人:如需进一步信息或资源请求,可联系主要联系人 Michiel Vermeulen(michiel.vermeulen@ru.nl)。
  2. 材料可用性:本研究中生成的质粒和细胞系可应要求提供。
  3. 数据和代码可用性:ChIP - seq 和 RNA - seq 数据集已存入基因表达综合数据库(Gene Expression Omnibus database),编号为 GSE249882。蛋白质组学数据集已通过 PRIDE 合作伙伴存储库存入蛋白质组交换联盟(ProteomeXchange Consortium),数据集标识符为 PXD047569、PXD048246 和 PXD058327。所有相互作用蛋白质组学实验的处理结果数据汇总表作为 Data S1 包含在内。原始蛋白质免疫印迹图像已存入 Mendeley,网址为https://doi.org/10.17632/tdgzfz4htz.1,自发表之日起可公开获取。本文报道的显微镜数据可应主要联系人要求提供。本文未报告原始代码。如需重新分析本文数据所需的任何其他信息,可向主要联系人索取。

致谢

研究团队感谢 Marieke Willemse 在共聚焦显微镜方面的培训和协助;感谢 Rob Klose 提供 SUZ12 - dTAG 细胞系,Danny Reinberg 提供 EED 突变细胞系,Brian Hendrich 提供 SALL4 KO 和野生型细胞系;感谢 Maarten van der Sande 和 Siebren Fr?lich 对 seq2science 管道的支持,以及 Sybren Rinzema 对测序数据的管理;此外,也感谢 Vermeulen 实验室的所有成员和 Reini Luco 提供的意见和建议。本研究得到了 ERC 巩固者资助(SysOrganoid;771059)、荷兰研究委员会(NWO)的 VENI 资助(VI.Veni.212.076)以及 NWO ENW XL 资助(OCENW.XL21.XL21.100)。Vermeulen 实验室是 Oncode 研究所的一部分,该研究所部分由荷兰癌症协会(KWF)资助。本研究还得到了 Oncode Accelerator(荷兰国家增长基金项目,资助编号 NGFOP2201)的支持。

作者贡献

D.W.Z.、G.v.M.、H.M. 和 M.V. 构思了本研究;D.W.Z.、S.S.、D.B.、Y.Y.、P.T.、M.W.D.R. 和 P.W.T.C.J. 进行了亲和纯化质谱实验;S.V. 和 M.D. 进行了组蛋白质谱实验;D.W.Z.、S.S.、D.B.、L.A.L. 和 M.P.A.B. 进行了 RNA - seq 和 ChIP - seq 实验;D.W.Z.、S.S. 和 D.B. 构建了敲入和敲除细胞系;D.W.Z. 和 S.S. 进行了计算分析;D.W.Z.、S.S.、H.M. 和 M.V. 撰写了本文;M.V. 和 S.S. 获得了研究资金。

利益冲突声明

作者声明不存在利益冲突。

STAR★Methods

  1. 关键资源表:详细列出了研究中使用的抗体、化学试剂、重组蛋白、商业检测试剂盒、实验模型、寡核苷酸、重组 DNA、软件和算法等资源的来源和标识符。
  2. 实验模型和研究对象详情:介绍了细胞培养和处理的条件,包括多种小鼠胚胎干细胞系在不同培养基中的培养方式,以及对细胞进行诱导降解、处理药物和诱导分化的方法。还描述了构建敲入细胞系的过程,包括使用 CRISPaint 技术对相关基因进行标记的具体步骤。
  3. 方法细节:详细描述了邻近标记实验、核提取和 GFP 下拉实验、全蛋白质组实验、质谱分析、蛋白质组数据分析(亲和纯化和全蛋白质组)、组蛋白提取、丙酰化和消化、液相色谱 - 串联质谱(用于组蛋白翻译后修饰分析)、蛋白质组数据分析(组蛋白翻译后修饰)、染色质富集、蛋白质免疫印迹、逆转录定量聚合酶链反应(RT - qPCR)、染色质免疫沉淀测序(ChIP - seq)、免疫荧光等实验的具体操作步骤。
  4. 定量和统计分析:实验的统计细节可在图注、正文结果和方法细节部分找到。

补充信息

提供了多个补充文件,包括包含图表和表格的 PDF 文件、Excel 表格等,涵盖了实验中的详细数据和结果,为研究提供了更全面的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号