单细胞CRISPR扰动技术揭示复杂遗传位点中功能性调控元件的精细定位与优先排序

【字体: 时间:2025年08月29日 来源:Cell Genomics 9

编辑推荐:

  本研究针对非编码区复杂遗传位点中因果变异和靶基因鉴定的难题,创新性地采用多重单细胞CRISPR干扰(CRISPRi)和激活(CRISPRa)扰动技术,系统解析了完美连锁不平衡(pLD)区域内表达数量性状位点(eQTL)的调控机制。研究发现62%的pLD信号存在多因果调控元件,超过三分之一的功能性调控元件缺乏经典表观标记,揭示了现有计算预测方法的局限性,为GWAS和QTL研究提供了新的功能验证范式。

  

在人类基因组中,约90%与疾病相关的遗传变异位于非编码区域,这些变异如何通过调控基因表达影响表型,一直是遗传学领域的核心问题。传统全基因组关联研究(GWAS)和表达数量性状位点(eQTL)分析虽然能识别相关位点,但在高度连锁的基因组区域中,精确鉴定因果变异和靶基因面临巨大挑战。统计精细定位方法在完美连锁不平衡(pLD)区域束手无策,而现有功能预测工具对调控元件活性的预测准确率有限。更复杂的是,越来越多的证据表明,许多功能性调控元件缺乏经典的表观遗传标记,使得基于染色质状态的预测方法存在明显盲区。

为突破这些技术瓶颈,Ke Zhao、Yao Zhou等研究团队在《Cell Genomics》发表了创新性研究成果。他们巧妙整合多重单细胞CRISPR扰动技术与多组学分析,在天然染色质环境下系统解析了复杂遗传位点中功能性调控元件的精细调控机制。研究选取81个在血液组织中重现的pLD eQTL信号,涵盖217个具有同等因果概率的lead eQTL变异(LEVs),这些信号来自GTEx v8、Geuvadis和BLUEPRINT等7个血液来源的WGS-eQTL数据集。

研究采用三大关键技术:(1)多重单细胞CRISPRi/a扰动:在近单倍体HAP1细胞系中构建dCas9-KRAB(抑制)和dCas9-VP64(激活)稳定表达系统,设计472个sgRNA(含39个非靶向对照)组成扰动文库;(2)单细胞多组学分析:结合10x Genomics单细胞RNA测序和Multiome ATAC+基因表达平台,检测14,000-17,000个细胞/样本的转录组和染色质可及性变化;(3)功能验证体系:通过4C-seq捕获染色质空间互作,荧光素酶报告实验验证调控元件的等位特异性效应,并建立CRISPR-Cas9编辑细胞系进行机制研究。

"多重单细胞CRISPR扰动全面区分pLD区域独立eQTL效应"部分揭示,62%(51/81)研究的pLD信号含有至少一个功能性调控元件,其中41.1%存在多个(2-6个)因果eCREs。有趣的是,仅17.6%调控最近邻基因,60.8%为远端调控,21.6%同时调控近端和远端基因。例如,rs3782235-tagged CRE特异性上调相邻RBMS2,而rs1049359-tagged CRE则影响远端RNF181和TMSB10表达。更复杂的案例中,rs4930698和rs79423518标记的两个eCREs共同调控PRDX5和TRMT112,4C-seq证实rs79423518-tagged CRE虽位于PRDX5下游20kb,但通过染色质环化与两个基因的启动子区直接互作。

"eCRE扰动与常规eQTL定位调控效应比较"显示,仅25.4%(39/153)的CRISPR鉴定eCRE-perturbGene对与GTEx或eQTLGen血液eQTL重叠。传统eQTL定位在TSS近端(平均26kb)有优势,而CRISPR扰动发现的调控关系平均距离达410kb。研究发现rs143558304除已知TPM4关联外,还通过长程互作调控FAM32A和900kb外的ILVBL。特别值得注意的是,位于同一拓扑关联域(TAD)内的eCRE-perturbGene对更可能共处于高LD区块(OR=12.57,p=8.58×10-10),揭示了遗传结构与三维基因组架构的潜在关联。

"内源扰动效应难以通过计算预测和功能注释评估"部分对20种计算方法进行系统评估,发现Eigen-PC、GenoCanyon等工具AUC仅约0.6。典型案例中,尽管rs80159064-tagged CRE缺乏表观标记且计算评分低,但CRISPRi和荧光素酶实验证实其与rs75446625-tagged CRE均能调控NUDT7,且具有等效的增强子活性和等位特异性效应。

"无偏内源扰动揭示大量未标记调控元件"的发现尤为惊人,36%(29/80)功能性eCREs在扰动前缺乏ATAC-seq、H3K27ac等经典标记。例如rs73156934-tagged CRE虽无表观标记,但调控远端CALD1(相距800kb),CRISPRi和基因编辑均证实其缺失导致CALD1启动子可及性异常增加。这些未标记调控元件(UREs)可能通过特殊机制(如转录因子SOX8/SOX6介导)发挥作用,暗示当前功能基因组学资源存在显著遗漏。

"CRISPRi/a效应组合分析提示人类基因组调控可塑性"发现24%CRISPRi处理意外上调靶基因,而CRISPRa也有抑制现象。11个eCRE-perturbGene对在两种扰动中均显著,这些元件多富集于活跃染色质标记区。距离分析显示,非常规效应(CRISPRi上调或CRISPRa下调)多发生在距TSS>100kb的远端区域,可能与三维基因组复杂调控网络有关。

这项研究通过创新性实验体系,首次在天然染色质环境下系统证实了pLD区域广泛存在的多因果调控现象,突破了传统eQTL精细定位的统计瓶颈。发现超过三分之一功能性调控元件缺乏经典表观标记,对现有功能注释资源提出了根本性质疑,为"缺失遗传力"问题提供了新解释。建立的多重单细胞CRISPR扰动框架,将推动非编码变异功能解析从统计关联向机制研究的范式转变,为精准医学时代的疾病机制研究和药物靶点发现奠定方法学基础。未来整合单碱基编辑和单细胞多组学技术,有望在单核苷酸分辨率上揭示基因调控的完整密码。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号