解析超保守区域的调控功能揭示其在人脑发育与疾病中的关键作用
《Communications Biology》:Characterizing and decoding ultraconserved regions uncovers their regulatory significance in human brain development and disorders
【字体:
大
中
小
】
时间:2025年11月29日
来源:Communications Biology 5.1
编辑推荐:
本研究针对超保守区域(UCRs)功能未知的科学难题,通过整合34个物种的基因组数据对UCRs进行系统鉴定与功能解码。研究人员发现UCRs在脊椎动物中大量出现,其突变率低但致病性变异比例高,并首次基于基因组背景将UCRs分为三类:I型(编码剪接调控因子)、II型(与脑瘤相关lncRNA关联)和III型(具增强子特性)。该研究为理解UCRs在神经发育障碍中的机制提供了新框架,对脑部疾病诊疗具有重要启示意义。
在基因组中存在着一些令人着迷的序列片段,它们在不同物种间保持着完美的序列一致性,这些被称为超保守区域(UCRs)。自Bejerano等人首次在人类基因组中发现481个UCRs以来,这些元素就因其极端的进化保守性而引发广泛关注。然而,尽管经过多年研究,大多数UCRs的具体生物学功能仍然是个未解之谜。更关键的是,当前研究仍主要依赖于2003年的早期基因组组装数据,随着测序技术的飞速发展,GRCh38.p14等高质量参考基因组的出现,为重新审视UCRs的功能提供了前所未有的机遇。
研究人员首先利用最新参考基因组重新注释UCRs,确认了479个保持完美保守性的元素,其中uc.18和uc.304因不再满足保守标准而被排除。分析显示UCRs主要长度为200-400bp,具有较低的GC含量和SNP密度,但致病性突变比例更高。进化分析表明UCRs最早出现在鱼类中,在脊椎动物中显著增多,提示其在脊椎动物特异性特征发育中的重要作用。
功能分析发现UCR相关基因具有广泛的组织表达模式,且其编码蛋白具有更强的蛋白-蛋白相互作用能力,显著富集于必需基因集中,特别是在生物分子凝聚体组装方面发挥重要作用。基于基因组背景,研究团队将UCRs分为三类:I型(65%,位于蛋白质编码基因内)、II型(21%,与非编码基因共定位)和III型(14%,位于基因间区)。
关键技术方法包括:利用NCBI Remap工具将UCR坐标更新至GRCh38.p14基因组;使用BLAST进行跨物种保守性验证;基于GTEx数据库进行组织特异性分析;通过Metascape进行GO富集分析;整合TCGA、GTEx和CGGA数据库进行肿瘤差异表达和生存分析;利用ENCODE项目的cCRE数据鉴定调控元件;采用DeepTools进行ChIP-seq和CUT&Tag数据分析。
I型UCRs分布于蛋白质编码基因的外显子区(126个)和内含子区(188个),其相关基因显著富集于脑发育和选择性剪接(AS)相关通路。外显子UCRs相关基因更倾向于参与AS调控(38%),而内含子UCRs相关基因则更多参与神经系统发育(33%)。
研究发现46个剪接相关基因与I型UCRs存在显著重叠,包括SR蛋白家族和hnRNP家族成员。这些剪接因子在脑发育过程中表达逐渐下降,特别是在谷氨酸能兴奋性神经元的发育轨迹中表现明显。在各类AS事件中,下调的盒式外显子(dCE)事件占主导地位,且SRSF1调控的GGA模序在dCE外显子中显著富集。SRSF6基因中的UCRs位于"毒害外显子"(poison exon)上,该外显子的使用频率在出生前后出现明显波动,通过无义介导的mRNA降解(NMD)机制精细调控SRSF6功能蛋白的表达水平。
II型UCRs作为胶质瘤的诊断生物标志物和预后指标
II型UCRs主要与lncRNA相关(99%),这些ncUCR基因在脑组织中特异性高表达,且富集于神经系统和肿瘤相关通路。在胶质母细胞瘤(GBM)和低级别胶质瘤(LGG)中分别鉴定出21个和17个差异表达的ncUCR基因,其中DLX6-AS1和LINC00609等与患者生存显著相关。
基于这些ncUCR基因构建的逻辑回归模型在独立验证集中对LGG和GBM的诊断AUC分别达到0.993和0.972,显示出优异的判别能力。
III型UCRs位于基因间区,其中32个(50%)与ENCODE项目定义的候选顺式调控元件(cCREs)重叠,包括30个增强子样区域。这些UCRs与邻近蛋白编码基因的距离主要在10,000-100,000bp范围内,符合增强子的长程调控特征。
组蛋白修饰分析显示,在脑类器官中III型UCRs区域的H3K4me1信号显著增强,而在脑组织中H3K27ac信号在III型UCRs区域呈现特异性富集。研究重点分析了Otp-uc.157、Pou3f3-uc.67和Pou3f4-uc.476三个与脑发育相关基因邻近的UCRs,发现它们具有典型的增强子特征,包括动态的组蛋白修饰模式、染色质可及性以及通过eHi-C验证的与靶基因启动子的相互作用。
该研究通过系统性的多组学分析,不仅更新了UCRs的注释目录,更重要的是建立了功能分类框架,揭示了UCRs在脑发育和疾病中的多层次调控机制。I型UCRs通过调控剪接因子表达影响神经发育过程中的选择性剪接;II型UCRs相关的lncRNA在脑肿瘤中表现出诊断和预后价值;III型UCRs则作为保守的增强子样元件调控神经发育关键基因。这些发现为理解基因组极端保守区域的生物学意义提供了新视角,为神经发育障碍和脑部疾病的机制研究和治疗策略开发奠定了重要基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号