Pvt1基因随机单等位表达的遗传与染色质调控机制及其在神经发育中的功能意义

《Cell Reports》:Genetic and chromatin regulation of Pvt1 monoallelic expression

【字体: 时间:2025年11月12日 来源:Cell Reports 6.9

编辑推荐:

  本研究针对随机单等位表达(aRME)的建立和维持机制不清的问题,通过分析120个神经祖细胞(NPC)克隆系的等位特异性RNA测序和表观基因组数据,揭示了287个aRME基因。研究发现致癌长链非编码RNA Pvt1的aRME受遗传变异通过差异TFAP2a结合而偏向,其单等位表达通过组蛋白修饰(如H3K4me3和H3K9me3)维持,并经由增强子-启动子竞争调控Myc表达,影响细胞增殖。该研究为理解aRME在发育和疾病中的作用提供了新视角。

  
在二倍体生物中,大多数基因从母本和父本等位基因均等表达。然而,一部分基因表现出单等位表达(ME),即一个等位基因活跃转录,另一个被沉默。这是一种表观遗传现象,DNA序列未改变,但单等位表达状态在细胞分裂和分化过程中稳定维持。ME基因可以是确定性的,如印记基因,其亲本表观遗传标记在发育过程中控制基因表达;也可以是随机单等位表达(RME),如雌性X染色体失活(XCI)。其他熟知的RME基因包括嗅觉受体、免疫球蛋白受体和原钙粘蛋白基因,它们分别促进受体多样性和塑造神经元身份。无偏研究表明,在某些细胞类型中,0.5%-10%的基因呈现常染色体RME(aRME),其表达模式随体细胞分裂稳定维持,且与亲本来源无关。
aRME基因的数量在小鼠胚胎干细胞(mESC)分化过程中增加,表明aRME在分化过程中建立。许多aRME基因在mESC中具有双等位可及的染色质,但在分化为神经祖细胞(NPC)后变为单等位可及,活跃等位基因上带有H3K4me3,非活跃等位基因上带有H3K9me3。然而,关于aRME的机制以及aRME是否在早期发育中精确调控基因表达,仍存在知识空白。本研究旨在筛选aRME基因,并阐明aRME在细胞分裂过程中建立和维持的机制及其功能后果。
研究人员对来自129S1与CAST/EiJ杂交F1代mESC分化产生的超过100个NPC克隆系进行了等位特异性RNA测序(RNA-seq)。利用两品系间约2400万个单核苷酸多态性(SNP),可以高分辨率追踪母本和父本等位基因的基因表达和染色质状态。通过将NPC进行亚克隆,获得克隆系,用于研究随细胞分裂稳定维持的ME。这种方法可以区分ME和短暂的转录爆发效应,因为单等位表达的克隆系中所有细胞共享相同的等位基因选择,而双等位基因在克隆系中保持双等位表达。
为了量化NPC中的ME,研究人员对46个雄性和74个雌性NPC克隆系进行了等位特异性批量RNA-seq。批量RNA-seq平均掉了单细胞水平看到的转录爆发。测序读数被映射到N-屏蔽参考基因组,并使用信息性SNP进行拆分,非信息性读数被排除。基因表达的等位基因比率(AR)计算为对齐的129读数除以CAST和129读数之和,再减去0.5。AR为-0.5、0和+0.5分别表示 exclusive CAST、equal和exclusive 129等位基因表达。
通过筛选在NPC中平均每百万转录本数(TPM)大于5的基因,得到10,318个基因。根据X连锁基因的基准,使用AR ≥ 0.3和AR ≤ -0.3将每个NPC克隆系中的每个基因分类为单等位或双等位。如果一个基因在至少40%的NPC克隆系中是单等位(相对于双等位)表达的,则被定义为单等位表达基因(ME cutoff为0.4;954个基因)。在排除所有X和Y连锁基因以及印记基因后,研究人员专注于常染色体ME(aME)基因。要确定一个基因为aRME,它必须至少在1个克隆系中呈现CAST单等位表达(AR ≤ -0.3),并至少在另一个克隆系中呈现129单等位表达(AR ≥ 0.3),最终得到287个aRME候选基因(占表达基因的2.7%),少于先前报道的数量。一个更广泛的包含638个aME基因(6.1%)的列表包括了aRME,以及不符合上述随机ME(RME)标准的aME基因。这些基因可能包含未分类的印记基因和在本F1杂交模型系统中显示出强烈遗传偏好的RME基因。
已知的双等位基因、X连锁基因和印记基因验证了该方法。在雄性NPC中,Xist和Mid2仅从母本X染色体表达;在雌性NPC中,Xist可以是随机单等位的,并带有129遗传偏好,而Mid2在活跃X等位基因上表达,一小部分克隆系显示父本X染色体丢失。有趣的是,Dlk1通常是父本表达的基因,但在神经微环境中以及我们的NPC克隆系中为母本表达。一些克隆系也显示部分基因的印记丢失,这在培养于2i+LIF条件下的mESC中是已知的。
值得注意的是,aRME基因在我们的杂交品系中显示出等位基因偏好的梯度。真正的aRME基因(如Eid1、Dbx2和Cbr3)在不同克隆系中具有稳健的单等位或双等位表达,而其他基因则显示出等位基因特异性偏好(129偏好:Gap43、Mettl5和Neat1;CAST偏好:Tubb3、Sox1和Pvt1)。为了可视化所有表达基因的变异及其基因分类,研究人员绘制了每个基因在所有雄性和雌性NPC克隆系中的AR均值与方差的关系图。大多数正常的双等位基因(如Sox2和Pax6)的AR均值接近零,方差很小。aRME基因的AR均值约为零,但方差较高;而具有遗传偏好的ME基因具有非零的AR均值和较低的方差。每个基因的RME程度存在多样性,有些基因显示出遗传偏好。通过筛选在不同克隆系中分别呈现CAST和129单等位表达的基因,排除了仅偏向一个等位基因的基因(如Tubb3和Gap43),这些基因被认为是aME基因,而非aRME基因。
在筛选出aRME基因后,研究人员接下来检查了哪些表观遗传标记与它们在细胞分裂过程中ME的维持相关。为此,他们在三个不同的F1-23 NPC克隆系(mE6 NPCs、Ch1 NPCs和Ch8 NPCs)中进行了等位特异性染色质免疫沉淀测序(ChIP-seq),检测了活跃和抑制性组蛋白修饰。为了广泛比较aRME基因的等位基因表达状态及其表观遗传标记,研究人员检查了活跃标记(H3K27ac、H3K4me2和H3K4me3)以及抑制性标记(H3K9me3、H2AK119ub和H3K27me3)。单等位表达的aRME基因的活跃标记ChIP信号通常低于正常的双等位基因。值得注意的是,尽管拷贝数不同,单等位和双等位表达的aRME基因具有相同水平的活跃标记,这暗示活跃标记并非简单叠加,并且aRME基因与正常表达基因相比存在独立的调控机制。
相反,抑制性组蛋白标记和DNA甲基化在aRME基因上总体较高,尤其是在转录起始位点(TSS)附近,其中H3K27me3在单等位和双等位表达的aRME基因之间显示出最显著的差异。除了Ch8克隆系可能由于ME状态差异外,双等位aRME基因比单等位aRME基因具有更多的H3K27me3信号。aRME基因的DNA甲基化与组蛋白修饰之间缺乏共聚类,表明重叠最小,提示aRME基因可能由不同的表观遗传机制维持。
当观察特定基因位点,如aRME基因Sox1时,其具有强烈的H3K9me3、H2AK119Ub和H3K27me3信号,这表明其单等位表达受H3K9me3和Polycomb复合物共同控制。相反,正常双等位表达基因Sox2沿基因体缺乏H3K9me3和H3K27me3标记,但带有H2AK119ub。然而,并非所有aRME基因都带有抑制性组蛋白修饰。例如,Mettl5缺乏这些标记,但在TSS下游富含DNA甲基化。总体而言,aRME基因的维持涉及细微且多变的表观遗传机制,具体取决于基因本身。
RNA-seq分析发现,Pvt1(一种被深入研究的致癌长链非编码RNA,位于一个致癌基因座)在NPC克隆系中表现出明显的向CAST背景倾斜的单等位表达,与其他aRME基因相比尤为突出。56个NPC克隆系单等位表达CAST等位基因,而只有4个克隆系单等位表达129等位基因,存在14倍的偏好。当检查几个选定基因的ME程度时,很明显每个基因都表现出独特的分布,这可能是由基因的固有特性和遗传差异的影响所驱动。这突显了根据所研究基因调整AR cutoff的重要性。在本研究中,研究人员关注Pvt1,并选择-0.2和0.2作为下游分析的AR阈值,因为该阈值能有效地将克隆系分为三组:CAST单等位、129单等位和双等位。
表观基因组分析显示,通过转座酶可及染色质测序(ATAC-seq)测量的染色质可及性以及增强子标记H3K27ac在Pvt1基因座的占据情况,在每个克隆系中都与表达状态等位匹配。在从mESC分化为NPC的过程中,Pvt1的染色质可及性和H3K27ac信号从双等位转变为单等位,表明转录沉默。相比之下,上游50 kb处的Myc在双等位上都保持表达和可及。
为了进一步研究Pvt1-Myc基因座的表观遗传景观,研究人员在一个Pvt1在CAST等位基因上ME的NPC克隆系、一个在129等位基因上ME的克隆系以及一个Pvt1双等位表达的克隆系上进行了组蛋白修饰和RNA聚合酶II(RNA Pol II)亚基RPB1的等位特异性ChIP以及亚硫酸氢盐测序。Pvt1 ME的克隆系显示,活跃等位基因的Pvt1启动子和基因体带有H3K4me2和H3K4me3标记,而非活跃等位基因的基因体则带有H3K9me3标记。在Pvt1双等位表达的克隆系中,H3K9me3信号相对较低。有趣的是,所有三个NPC克隆系的两条等位基因在Pvt1的TSS上游和下游都具有H2AK119ub信号。在mESC中,两条等位基因上都有H3K4me2/3信号,并且TSS上游/下游存在H3K27me3信号,但在NPC中基因体上缺失,表明存在一个二价启动子,该状态在分化过程中得以解决。相比之下,Myc启动子在两条等位基因上都保留活跃标记且缺乏抑制性标记。
亚硫酸氢盐测序显示Pvt1-Myc基因座没有DNA甲基化,这与ME基因(如Mettl5和Dlk1)不同。非活跃的Pvt1等位基因在启动子区域有更高的RNA Pol II占据,表明RNA Pol II停滞,而活跃等位基因在启动子区域的Pol II占据较低,提示其处于暂停释放状态,这与其等位基因转录输出一致。在一个Pvt1双等位NPC克隆系中,RNA Pol II存在于两条等位基因上,在129等位基因上的信号略高。总体而言,数据表明H3K4me2/3、H3K27ac、H3K9me3和H2AK119ub与NPC中细胞分裂过程中Pvt1 ME的维持相关。
为了确定在没有遗传差异的情况下Pvt1是否能实现真正的随机单等位表达,研究人员对129 x 129 R1 mESC进行了基因编辑,使其在外显子9上有一个单碱基改变,从而可以区分野生型(WT)和编辑过的等位基因(R1-57品系)。与F1杂交NPC克隆系中强烈的CAST偏好相反,R1-57 NPC克隆系中的Pvt1没有显示出等位基因偏好,任一等位基因均等可能地发生ME。这符合aRME基因的预期分布,表明Pvt1的ME与亲本来源无关。跨传代的时间过程实验表明,Pvt1的ME在非杂交品系中是恒定的,证实了等位基因的选择是通过表观遗传方式随细胞分裂维持的。这一观察表明,在没有遗传差异的情况下,Pvt1 ME的起始和等位基因选择是一个随机随机过程的一部分;然而,遗传差异会扭曲这个随机过程,因为大多数克隆系表达来自CAST等位基因的Pvt1,而非129等位基因。仔细检查Pvt1启动子的可及区域,发现了五个SNP差异与两个等位基因之间的差异ATAC信号重叠,这很可能归因于CAST偏好。
接下来,研究人员试图确定可能导致Pvt1的RME偏向CAST而非129遗传背景的因子。为此,他们对Pvt1 ME CAST克隆系与Pvt1双等位表达克隆系进行了差异基因表达分析。该分析确定了转录因子基因Tfap2a,它是神经嵴细胞谱系的关键转录因子。在F1杂交NPC克隆系中,Pvt1 129 ME克隆系的Tfap2a表达高于大多数Pvt1双等位克隆系,而Tfap2a表达在Pvt1 CAST ME克隆系中最低,表明其与Pvt1 CAST表达呈负相关。在没有遗传差异的R1-57 NPC克隆系中,Tfap2a表达在不同克隆系之间没有差异,进一步表明Tfap2a可能是遗传偏斜的基础。
对Pvt1启动子的基序分析显示,在一个SNP附近预测有一个Tfap2a结合位点。FIMO(Find Individual Motif Occurrences)分析预测TFAP2a结合基序在129启动子上的结合更强,尽管ME偏向CAST等位基因。基于对其他预测占据Pvt1启动子并与SNP重叠或相邻的转录因子的检查,Six3或NeuroG2在Pvt1单等位CAST和双等位克隆系之间的表达没有显著差异。
在mESC和NPC中进行的TFAP2a ChIP证实了其优先结合到Pvt1启动子的129等位基因上,这与FIMO的预测一致。为了检测单个SNP是否影响TFAP2a结合,研究人员在含有不同Pvt1启动子的质粒的细胞上进行了TFAP2a ChIP-qPCR。ChIP-qPCR显示,当Pvt1 CAST启动子被编辑为含有129 SNP时,与未编辑的CAST启动子以及被编辑为含有CAST SNP的129启动子相比,ChIP富集度显著增加。结果表明,TFAP2a结合基序周围的单个SNP影响了TFAP2a的结合。
在mESC中,129等位基因在Pvt1启动子处显示出更强的H3K27ac和H3K4me3信号,并且Pvt1启动子的内源性标记证实129启动子比CAST启动子转录更活跃。当TFAP2a表达较低时(如Pvt1 CAST ME克隆系),结合事件也较少,这可能导致随机的TFAP2a结合偏向于固有"更强"的129等位基因。此外,当Tfap2a表达较高时(如Pvt1 129 ME克隆系),TFAP2a大量占据129等位基因,但在CAST等位基因上的结合也增加,表明对SNP驱动的差异敏感性降低,使得等位基因选择偏向性减小。
为了进一步验证模型,研究人员试图探究过表达Tfap2a是否足以恢复F1-23杂交NPC中RME的平衡。他们用多西环素(dox)诱导的Tfap2a过表达质粒转导了F1-23 mESC。然后,他们在整个mESC分化过程中以及在一个稳定的NPC克隆系中加入dox,以回答在Pvt1 ME建立期间或之后增加Tfap2a表达是否会影响等位基因选择。在分化过程中诱导Tfap2a过表达导致非克隆NPC群体中Pvt1的AR平衡,而在已建立的NPC克隆系(mE6 NPCs,具有CAST ME)中诱导Tfap2a过表达则导致AR向双等位表达转变。这些数据支持了一个模型,即Tfap2a表达水平通过差异结合到Pvt1启动子来调节Pvt1 aRME的遗传偏斜,其中SNP差异影响了结合亲和力。
为了探究aRME的功能后果,研究人员测试了Pvt1 ME是否影响细胞增殖。他们将表达绿色荧光蛋白(GFP)的Pvt1单等位表达NPC与表达红色荧光蛋白(RFP)的Pvt1双等位表达NPC以相等数量共培养,并随时间追踪它们的相对丰度。在F1-23杂交和R1-57非杂交NPC克隆系中,Pvt1单等位表达细胞在传代过程中相对于双等位表达细胞显示出生长优势,表明无论是否存在遗传差异,Pvt1单等位表达都能赋予增殖优势。有趣的是,当比较各个克隆NPC系中Pvt1的表达和AR时,观察到单等位克隆中Pvt1的表达高于双等位克隆,从而逆转了基因拷贝数与表达水平之间的预期关系。在非杂交R1-57品系中也观察到了相同的趋势,表明这种效应是基因固有的,与遗传差异无关。
接下来,研究人员探究这种生长优势是否是由于与Myc(一个邻近的双等位表达基因)的相互作用所致。Myc表达水平在杂交和非杂交克隆系之间没有显著差异。然而,比较所有NPC克隆中Pvt1的AR与Myc的AR,发现在每个克隆系中它们的AR呈负相关,提示Pvt1 ME对Myc表达存在顺式抑制作用。当以等位基因特异性方式观察Pvt1表达与Myc表达时,也得出了相同的结论,突显了进行等位基因特异性分析以检测这种调控的重要性。
为了进一步研究Pvt1和Myc之间的顺式调控,研究人员进行了等位特异性H3K27ac HiChIP(一种捕获染色体构象的蛋白质导向方法)和H3K27ac ChIP-seq,以研究两个等位基因之间的三维增强子连接组。当Pvt1启动子活跃时,Myc主要与Pvt1启动子接触,而Pvt1也与Myc接触。然而,在Pvt1非活跃等位基因上,Myc获得了与Pvt1内含子内的至少四个基因内增强子的接触,证明了该基因座内的增强子-启动子竞争。在单等位表达克隆系中对Pvt1启动子进行等位基因特异性CRISPR激活,导致靶向等位基因上Pvt1表达增加和Myc表达减少,证实了顺式调控效应。这些发现共同表明,Pvt1的单等位可及性在早期发育中为Pvt1-Myc基因座增加了额外的基因调控层。通过揭示Pvt1单等位表达与Myc之间的动力学,研究人员为理解RME基因如何在其基因座内充当调控控制以驱动不同的早期分化程序提供了见解。
最后,研究人员观察到并非所有aRME基因都像Pvt1一样。例如Cbr3、Eid1和Sox1等基因在双等位 versus 单等位表达克隆中表现出表达增加,其中Sox1显示出遗传效应。另一方面,也存在一些aRME基因,如Mettl5和Neat1,它们与Pvt1相似,在ME versus 双等位克隆中表达更高,其中Neat1也显示出遗传效应。通过这些数据,研究人员展示了ME如何影响基因表达和基因座调控(如Pvt1-Myc),以强调aRME基因在早期发育中的多样化功能作用。
本研究分析了120个NPC克隆系,以无偏地识别在NPC中表现出多样化ME模式的基因。大量的等位特异性RNA-seq数据使得研究人员能够将AR与基因表达以及它们可能相互作用的基因的表达水平相关联。三个NPC克隆系的全面表观基因组分析揭示了aRME基因上的表观遗传标记,为进一步探索ME的机制和后果奠定了基础。
聚焦于Pvt1,研究人员利用该数据集研究了Pvt1的AR、表达以及与其他基因的相互作用,区分了遗传和表观遗传对NPC中Pvt1 ME的贡献。研究人员先前表明Pvt1经历aRME,但更广泛的克隆分析发现了Pvt1 ME中的CAST偏好,并揭示了遗传差异可以扭曲原本应是随机的随机过程。这些数据集为更深入地探索aRME基因、它们的机制和影响奠定了基础。
在机制上,数据支持一个模型:当Tfap2a表达低且结合不频繁时,Pvt1等位基因选择涉及一个偏向的随机过程,其中初始活跃的等位基因在分化过程中被沉默。然而,当Tfap2a表达高且Pvt1启动子占据率高时,随机过程不再偏向。aRME的起始和选择一直被认为是由随机过程驱动的真正随机过程的一部分;然而,研究表明,在这种模型中不能忽视遗传差异的贡献。就Pvt1而言,转录因子结合的差异可以扭曲杂交品系中的随机过程。在未来的研究中,探索常见遗传变异如何调节aRME基因并影响关键生物学过程将是非常有趣的。
研究人员发现大约6%的基因显示常染色体单等位表达,而2.7%的基因呈现aRME;然而,aRME的功能后果却鲜为人知。aRME基因很可能在发育中扮演关键角色,因为RME基因的数量随着分化而增加,并且可以通过可变地呈现单等位或双等位表达来创造细胞异质性。就Pvt1而言,拥有ME会导致明显的生长表型,这在祖细胞(如NPC)开始分化为不同神经元谱系时创造了细胞异质性。有趣的是,观察到的生长表型可能来自两个来源:(1)由于增强子-启动子竞争导致Myc表达在顺式方向上增加;(2)单等位表达克隆中Pvt1表达的转录过度补偿。Pvt1在发育和癌症背景中均被证明能促进增殖。
此外,关于aRME基因的研究主要集中在H3K4me3、H3K9me3和DNA甲基化上,以理解单等位表达的表观遗传维持;然而,研究表明Pvt1启动子被H3K4me3和H2AK119ub双重标记,此外还有其他常见标记。在mESC中,该启动子也被H3K4me3和H3K27me3标记。已知二价启动子标记发育和谱系特异性基因,以实现快速转换,这支持了aRME基因在早期分化中参与细胞分化和身份识别的假说。在癌症背景下,已知具有二价启动子的发育基因会因H3K4me3的缺失而成为异常高甲基化的靶标。就Pvt1而言,理解早期发育过程中的表观遗传景观为了解Pvt1在成人癌症中如何失调提供了见解。这就像一把双刃剑,二价性和ME在早期发育中是有利的,但使得Pvt1在成人癌症中更容易发生甲基化。
虽然在此详细介绍了Pvt1 ME的遗传和表观遗传机制及其功能后果,但列表中还有一些aME基因与神经发育障碍相关,例如Grik3、Mettl5、Gap43和Tubb3。此外,还有一些aME基因,当其失调时与癌症相关,例如Mmp14、Nid1、Mdm2、Cd36和Id3。对这些基因的进一步研究可以为理解ME在发育和癌症中的功能后果提供宝贵信息。此外,展示遗传变异对aRME影响的数据为未来深入研究自然遗传变异如何影响aRME基因,并可能影响大脑发育、神经发育障碍和癌症奠定了基础。
本研究依赖于来自杂交mESC的克隆NPC系,可能无法完全概括体内发育过程。此外,批量RNA-seq和ChIP-seq方法虽然强大,但会平均细胞间的信号,可能掩盖单细胞变异性或短暂状态。虽然阐明了Pvt1 aRME的机制,但这可能无法推广到其他aRME基因。需要进一步研究以建立aRME基因的通用机制模型。此外,结合体内模型和单细胞数据将进一步增强本研究的结论。
主要技术方法包括:利用129S1与CAST/EiJ杂交F1代小鼠胚胎干细胞(mESC)分化为神经祖细胞(NPC),并建立超过100个克隆系进行等位特异性RNA测序(RNA-seq)分析;通过染色质免疫沉淀测序(ChIP-seq)分析组蛋白修饰(H3K27ac、H3K4me2、H3K4me3、H3K9me3、H2AK119ub、H3K27me3)和RNA聚合酶II占据;使用转座酶
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号