《Developmental Neurobiology》:Chromatin Profiling Reveals Distinct Male and Female Trajectories for Developmental Learning Potential
编辑推荐:
神经发育与行为可塑性中的表观遗传调控机制研究:以斑胸草雀听觉皮层为例
研究揭示了发育经历如何影响成年行为,尤其是在特定年龄阶段,这些阶段被称为关键期或敏感期,对大脑结构和功能具有长期影响。表观遗传机制在调控大脑成熟和经验过程方面发挥重要作用,通过协调涉及组织和可塑性的基因的转录。因此,表观遗传学在关键期的研究中具有特别重要的意义。本研究采用染色质免疫沉淀测序(ChIP-seq)技术,以H3K27ac这一组蛋白标记为依据,评估了可访问的调控区域。这些区域是转录因子(TFs)结合的位置,我们关注的是与发育性听觉学习相关的听觉前脑区域,研究对象为幼年雄性和雌性斑马雀(*Taeniopygia guttata*)。
尽管雄性和雌性都依赖于发育性听觉学习来影响成年行为,但雄性具有明确的关键期,而雌性是否具有类似的关键期尚不明确。因此,我们提出了两个主要问题:(1)雄性在进入关键期时,H3K27ac峰是否会变化?如果变化,如何?(2)雌性在相同发育阶段的H3K27ac峰是否相似?通过分析,我们发现年龄和性别会影响基于H3K27ac的峰图谱,以及这些区域内的富集转录因子结合位点(TFBS)和标注到这些H3K27ac定义峰的基因。这些发现为理解表观遗传调控如何影响听觉前脑组织和功能提供了新的视角,并为进一步研究奠定了基础。
斑马雀是研究发育性学习的典型模型,雄性通过在出生后第30至65天期间学习成年“导师”歌曲,为自己的成年歌曲结构提供模板。由于雄性成年后每天都会唱歌,因此这一受限的时期反映了学习能力的变化,而不是对相关经验的访问。雌性虽然无法唱歌,但它们也进行幼年听觉学习,这种学习影响其成年歌曲偏好。研究发现,雌性学习的年龄与雄性学习的关键期重叠,但尚不清楚这些年龄是否与雄性一样受限。
分子和功能测试表明,幼年听觉学习需要雄性和雌性共同的听觉前脑区域。然而,即使在相同的年龄,雄性和雌性可能使用不同的机制来学习。本研究旨在描述听觉前脑的基本分子特征,以识别可能影响学习能力的组织特性。我们采用ChIP-seq技术,这是一种能够进行全基因组研究的发现工具,而不是以往研究中关注的单个基因或蛋白质。我们使用H3K27ac ChIP-seq来识别可访问的调控区域,包括可能的近端启动子和增强子。
我们对雄性和雌性的听觉前脑在两个年龄进行了分析,分别是雄性关键期开始的P30和我们观察到性别差异的分子学习反应的年龄。我们进行了一系列分析,以识别基于年龄和性别的差异调控区域,预测这些区域内的富集TFBS,并识别可能受影响的基因。研究结果提供了关键期开始时协调学习能力的分子机制的更多具体性,并为未来机制性研究提供了证据。
研究方法包括动物饲养和样本收集,所有实验动物来自伦敦实验室的繁殖群,饲养在14小时光照和10小时黑暗的周期下。为了测试年龄和性别对染色质特征的影响,雄性和雌性均在“正常”条件下饲养,它们的整个生命周期都在孵化的社群笼中度过。雄性和雌性分别在P23和P30时被采集样本。听觉前脑样本在6-8小时光照开始后被收集,并在2分钟内完成牺牲后立即用干冰冷冻。样本收集时间在2019年8月10日至9月29日之间,所有组织储存于-80°C,直到ChIP处理开始。
为了获得足够的染色质进行成功的H3K27ac ChIP-seq,每个分析样本是三个个体的听觉前脑的混合。共有四个ChIP-seq组:P23雄性(P23M)、P23雌性(P23F)、P30雄性(P30M)和P30雌性(P30F)。对于RNA测序(RNAseq),我们独立收集了P23M、P23F、P30M和P30F的听觉前脑样本。为了获得基线RNA测量,雄性和雌性在P22或P29时被放置在声学隔离室中过夜,之后在第二天早上6-8小时,听觉前脑被解剖并迅速冷冻,储存于-80°C直到处理。没有进行样本混合,每个RNAseq样本对应一个个体,共有四个样本。
所有鸟类的性别通过观察睾丸或卵巢确认。为了避免因遗传相关性或父母行为引入偏差,ChIP-seq样本和RNAseq样本均不含同窝兄弟的组织。ChIP-seq用于H3K27ac组蛋白修饰的分析,采用Active Motif公司提供的已验证抗体进行免疫沉淀。未免疫沉淀的DNA混合样本作为输入对照。所有测序数据均使用Illumina NextSeq 500平台获取,获得75个碱基的单端读数。
ChIP-seq数据的质量评估和基因组比对使用FastQC和Trim Galore进行。在去除低质量核苷酸和接头序列后,我们过滤出长度小于21个核苷酸的读数,然后进行后续分析。读数被比对到斑马雀基因组组装(RefSeq bTaeGut1.4.pri),使用Bowtie 2进行,设置默认敏感参数。SAMtools用于转换SAM和BAM文件格式,过滤未唯一比对到基因组的读数,并生成对应的索引文件。测序数据文件可在NCBI BioProject PRJNA1256487中找到。
我们首先使用MACS2对每个样本进行峰识别,与输入进行比较,考虑峰一致性检查和IDR。然后,我们比较雄性跨年龄(P23M vs. P30M)、雌性跨年龄(P23F vs. P30F)以及雄性和雌性在相同年龄(P23M vs. P23F和P30M vs. P30F)之间的差异。使用DiffBind的DESeq2核心程序进行差异分析,设置默认参数和完整的库大小归一化。由于H3K27ac ChIP-seq可以返回不同长度的峰,差异区域的识别同时考虑了DiffBind的summit参数。输出使用bedtools进行合并,保持重叠区域的更宽峰。差异H3K27ac占有率(FDR < 0.05)的区域被报告并用于基因预测。使用ChIPseeker和NCBI基因组注释进行差异区域的注释,确定峰在基因组特征中的分布,并分配可能被调控的蛋白编码基因。
为了进一步识别TFBS,我们首先在所有样本中识别出更宽的峰(q值截止为0.1),因为这些区域更准确地识别出核小体自由区(NFRs)。然后,我们将这些NFRs与差异区域进行比较,生成FASTA文件用于TFBS分析。使用Simple Enrichment Analysis(SEA)进行TFBS富集分析,背景模型通过打乱输入序列生成,E值截止为10。JASPAR CORE(2022)非冗余脊椎动物数据库用于测试的TF模体。识别出的TF通过与GTEx门户进行比较,检查其在成人皮层中的表达情况。
GO术语富集分析用于研究TF和预测基因的功能,使用ShinyGO v0.80进行。使用人类基因组(GRCh38.p13)进行GO分析,使用HGNC基因名称。背景由基因组中的所有蛋白编码基因组成。许多富集的TFBS涉及蛋白二聚体,但GO不接受蛋白二聚体作为输入,因此在进行GO分析时,TFBS二聚体被拆分为其组成蛋白。我们重点关注与神经系统有明显联系的结果,尽管某些类别反映了现有知识,因此某些后续重要的TFBS或基因可能未在图中显示。我们排除了与mRNA转录直接相关的GO术语。
为了验证ChIP-seq结果,我们设计了10对PCR引物,用于P30M与P30F的差异峰分析,并设计了一个围绕*MYH7B*基因的引物,该基因在脑中表达较低。PCR反应效率通过稀释曲线分析确定,引物特异性通过熔解曲线分析和凝胶电泳进一步验证。所使用的引物序列在表1中列出。
实时PCR在三重复的20 μL反应中进行,包含0.046 μg的免疫沉淀染色质,使用SsoAdvanced Universal SYBR Green Supermix进行。反应在CFX384 Touch实时PCR机上进行,使用以下循环条件:初始变性与聚合酶激活在98°C下进行3分钟,然后在98°C下变性15秒,退火/延伸在60°C下进行30秒,共进行50次循环。负对照反应的Cq值最高可达41.4。对于每个生物样本(n=3每组),计算目标引物组和GAPDH的技术重复的平均Cq值。ΔCq值通过从目标引物组的平均Cq值中减去GAPDH的平均Cq值计算(ΔCq = Cq_Primer - Cq_GAPDH)。相对表达通过2ΔCq方法进行。使用单因素方差分析(ANOVA)和事后Tukey-HSD检验来识别实验之间的潜在统计差异,显著性阈值设置为α < 0.05。
为了提供RNA数据集以支持ChIP-seq发现,我们使用Rneasy Micro Plus试剂盒(Qiagen,#74034)和RNase-Free DNase I处理(Qiagen,#79256)从幼年雄性和雌性的听觉前脑中分离RNA。我们制备了PolyA选择的RNA文库,并使用NovaSeq 6000平台进行测序,获得了150个碱基的配对读数。读数使用Partek Flow进行处理和质量检查,使用STAR(v2.7.8)对斑马雀参考基因组(bTaeGut1.4.pri)进行比对。RNA丰度使用库大小归一化的数据(每百万计数[CPM])进行计算,低丰度特征通过最低平均覆盖阈值(1.0)进行去除。差异表达使用Partek Flow进行评估,使用单因素方差分析(ANOVA),然后进行多重测试校正,采用Benjamini–Hochberg(步进)程序。我们比较了跨年龄(P23M-P30M,P23F-P30F)和性别(P23M-P23F,P30M-P30F)的情况。显著的基因名称作为单个排序列表提供给GOrilla,以评估功能富集类别,使用人类参考(Eden et al.
2009)。最终读数计数大于2的基因与从ChIP-seq分析生成的TFBS和预测基因列表进行交叉参考。
研究结果表明,ChIP-seq数据具有高质量(表2,图1,表S1,图S3)。每个样本平均获得约34,271,218个读数(最低为28,988,336个;表2,表S1)。样本中的碱基中位质量评分为36,没有任何位置的评分低于32(数据未显示)。在读数修剪后,样本保持平均33,182,950个读数(最低为28,135,662个;表S1)。质量指标在样本之间相似(表2,表S1)。单因素方差分析显示,组别对去除读数无显著影响(F(3,8) = 3.14,p = 0.087;范围为1.1%–6.2%),比对到基因组的读数比例(F(3,8) = 0.926,p = 0.47;范围为94.99%–95.77%),比对到峰的读数比例(F(3,8) = 1.15,p = 0.39;范围为19.1%–26.2%),平均峰长度(F(3,8) = 0.496,p = 0.69;范围为656–698),或平均峰信号值(F(3,8) = 1.083,p = 0.41;范围为4.1–4.9)。个体重复之间的相关值显示,同性别和同年龄样本比不同年龄和性别的样本更为相似;样本“P30F-N1”显示的关联性低于其他样本,为0.7(图S3a)。在DiffBind分析之前,峰数量存在显著的主效应(F(3,8) = 6.58,p = 0.015),事后Tukey-HSD检验显示P23M样本的峰数量显著高于P30M样本(p adj = 0.018;表2,表S1)。
在P23和P30雄性听觉前脑的H3K27ac峰比较中,我们发现有61个统计上显著的差异区域(图2a,表S2)。这些区域中,P23M-over-P30M区域富含一个TF(MEF2A)的结合位点,而P30M-over-P23M区域则富含13个TF的结合位点,包括MEF2D(图S4a,表S3)。GO术语分析显示,这些TF的富集区域涉及细胞增殖、分化、组织发育,以及特别与大脑发育相关的主题,如神经发生(ARX、LHX4、HOXD3、EN1、GBX2)、神经元分化(ARX、LHX4、HOXD3、EN1、GBX2)、凋亡(TFAP2B、EN1)、区域化(HOXD3、EN1、GBX2、HOXB4、HOXC4)和投射引导(ARX、LHX4、GBX2;图2b,表S4)。
我们进一步分析了P23和P30雄性听觉前脑的差异区域,将其与蛋白编码基因进行注释,并进行了GO功能分析(表S2和S5)。仅有的显著富集类别是与血脑屏障相关和碳水化合物结合(图2c,表S5)。P30M-over-P23M区域的基因富集类别显示与突触功能相关的主题,尤其是谷氨酸能信号(如*CACNG3、SYT1、GRM4、GRIA3、KCTD16*;图2d,表S5)。
在P23和P30雌性听觉前脑中,仅有6个显著的差异区域(图3a,表S2)。其中5个区域在P30雌性样本中更为可访问(P30F-over-P23F),而一个区域则是在P23雌性样本中更为可访问(P23F-over-P30F)。我们识别了在这些差异区域中富集的TFBS。由于无法对P23F-over-P30F峰进行TF模体富集分析,但P30F-over-P23F区域富含14个TF的结合位点(图S4b,表S3)。尽管数量较少,但GO术语分析显示,这些TFBS涉及细胞增殖、分化、组织发育和响应等主题,包括FOSL2、HOXD13、JUND、FOSL1、JUN、ETV2、BATF3、BATF和JUN(图3b,表S3)。
性别特异性TF模体在P23和P30的听觉前脑中均被识别,这些模体在雄性和雌性之间显示出不同的特征。共享的雄性TF模体是在P23和P30雄性-雌性比较中富集的TFBS,而共享的雌性TFBS是在P23和P30雌性-雄性比较中富集的。在排除核心TF模体后,19个TFBS仅在雄性-雌性比较中出现,而8个TFBS仅在雌性-雄性数据集中出现(图S6,表S2和S6)。雄性专属TF模体包括IEGs(如EGR-1和JUN二聚体)和NRF1。JUNB::FOSL1二聚体在雌性专属TFBS列表中被富集,ONECUT1和DUX也被富集。GO术语分析显示,雄性专属TFBS涉及细胞增殖和存活、髓鞘化和响应等主题(图5c,表S4和S6)。雌性专属TFBS涉及发育和代谢等主题(图5d,表S4和S6)。
直接性别比较突出了不同的特性。例如,基于P30雄性专属TFBS的分析,发现与CNTF介导的信号通路和Rho与Ras信号传导相关的主题被富集。CNTF作为神经系统细胞的存活因子,通过影响发育性性别特异性行为,对神经系统发育具有重要作用。Rho和Ras是相互连接的GTP酶依赖分子级联,涉及几乎所有神经发育的方面,包括神经发生、神经元分化、囊泡运输和突触可塑性。Ras和Rho的主要下游效应通路是ERK和mTOR级联,这些通路对雄性幼年听觉学习至关重要。从P30雄性-雌性比较中注释的基因显示了与学习和记忆相关的突触可塑性特征,以及神经发育过程和认知发展。
研究结果也有一定的局限性。技术上,TFBS预测仅是初步的,而蛋白质与特定DNA序列的结合过程无法完全通过序列模体分析捕获。此外,尽管在验证* cis* -调控元件的功能方面取得了进展,但不同的峰识别算法返回的差异区域集不同,模体在不同TF之间经常相似,尤其是在家族内部。我们仍然假设调控区域与转录元件的注释参数。这些假设无疑简化了基因组中存在的一些构象关系。我们认识到,一些发现可能与大脑或发育无明显直接联系,目前尚不清楚这是否反映了技术或知识的局限性。由于听觉前脑的体积较小,我们混合了个体以创建批量测序样本。大脑还包括多种细胞类型,这些细胞类型在我们的批量测序方法中被共同分析。然而,我们考虑了遗传相关性,并使用了遗传异质性群体的动物。鉴于鸟类和组织的生物学异质性,结果必须足够稳健,以从这种变化中显现,从而增加我们对结果的信心。
本研究的发现为未来工作提供了基础,以测试特定TF、基因和过程在成熟和经验依赖性对神经组织和功能的贡献。例如,获取听觉前脑在单细胞水平上的更多分辨率,将这些数据与其他物种的表观遗传和转录组数据进行更多比较,利用生物验证增强子序列,并对从H3K27ac定义峰预测的TF和基因进行功能测试。
总之,目前我们的数据与先前的分子和行为证据一致,表明雄性和雌性斑马雀在学习导师经验的方式和时间上存在性别差异。我们的研究重点在于可能的调控区域,以识别可能参与发育性学习的TF。由于TF的功能是协调基因组的转录,它们为支持或限制听觉学习的过程提供了重要见解,并揭示了雄性和雌性之间共享和独特的机制。我们通过多种方式评估了H3K27ac ChIP-seq数据,以提供全面的视角并增加对结果的信心。由于涉及大脑发育和学习的研究有限,我们不得不对预测的TF和基因进行功能信息的推断。然而,这项研究揭示了与特定过程相关的线索,提供了进一步研究大脑组织和功能组织的关键目标。