编辑推荐:
为解决现有多组学技术在基因调控机制研究中缺乏多重性和扩展性的问题,研究人员开展单细胞超高通量多重测序(SUM-seq)技术研究,实现染色质可及性和基因表达共分析,揭示调控动态,为相关研究提供高效方案。
在生命科学研究领域,基因调控机制一直是探索细胞命运、疾病发生的核心方向。然而,现有的多组学技术在研究增强子和转录因子(TF)等关键调控元件时,普遍面临着多重性不足、扩展性受限的瓶颈,难以在单细胞分辨率下同时解析复杂的基因调控动态。尤其是大多数疾病相关遗传变异位于非编码区,且许多疾病与转录因子驱动的基因调控过程紊乱密切相关,这使得开发一种能够在单细胞水平联合分析染色质可及性和基因表达、并适用于大规模样本的技术成为迫切需求。
欧洲分子生物学实验室(EMBL)的研究人员针对这一挑战,开展了单细胞超高通量多重测序技术(SUM-seq)的开发与应用研究。相关成果发表在《Nature Methods》上,为基因调控网络的深入解析提供了突破性工具。
研究人员主要采用了两步组合索引方法,结合微流控和板式索引技术,实现了单细胞水平染色质可及性(ATAC-seq)和基因表达(RNA-seq)的同步分析。该技术通过双条形码标记单个细胞核,可在单个微流控通道中处理超过 5 万个细胞,成本低至每个细胞 < 0.05 欧元,且兼容固定和冷冻样本,适合长时间样本收集的实验设计。
研究结果
SUM-seq 技术性能验证
通过人鼠细胞混合实验验证,SUM-seq 在单个 10x Chromium 通道中实现了 10 万个双条形码核的加载,经优化后碰撞率仅为 0.1%(RNA)和 3.8%(ATAC),且冷冻保存对数据质量影响极小。与现有技术相比,其染色质可及性片段数和基因检测数表现优异,尤其在超高通量场景下数据复杂度显著优于 SHARE-seq、Paired-seq 等方法。
巨噬细胞极化的动态调控解析
利用 SUM-seq 对人诱导多能干细胞(hiPS)来源的巨噬细胞极化过程进行时间序列分析,成功捕捉到 M1(促炎)和 M2(抗炎)极化轨迹中不同时间点的基因表达和转录因子活性变化。通过多组学因子分析(MOFA),鉴定出 M1 极化的早期(IFN-γ 信号)、持续(ISGF3 复合物)和晚期(抗原呈递)反应因子,以及 M2 极化的 IL-4 信号和代谢重编程相关因子。基因调控网络(GRN)分析揭示了 STAT1 从同源二聚体向 ISGF3 复合物的功能转换,且与免疫疾病相关遗传变异显著富集,如炎症性肠病(IBD)相关 SNP rs153109 与 IL-27 调控区域关联。
原发性 T 细胞亚群的调控景观定义
在 CD4+ T 细胞分化实验中,SUM-seq 清晰区分了 Th0、Th1、Th2、Th17、iTreg 等亚群,鉴定出亚群特异性转录因子(如 Th1 的 STAT4、Th2 的 GATA3)和刺激响应因子(如 AP-1 复合物)。染色质水平分析显示,不同亚群具有独特的可及性区域,且供体间差异揭示了个体免疫背景对 T 细胞分化的影响。
CRISPR 筛选揭示谱系转录因子功能
通过阵列式 CRISPRi/a 筛选,靶向 GATA2(中胚层)、SOX17(内胚层)、NR4A2(神经外胚层)等谱系转录因子,发现 GATA2 敲低可诱导非造血内皮谱系向骨骼肌肉发育方向转变,而 NR4A2 过表达促进神经外胚层命运。结合伪时间分析和基因调控网络,解析了转录因子扰动对细胞分化轨迹和功能基因模块的动态调控机制。
结论与意义
SUM-seq 作为一种成本高效、可扩展的单细胞多组学技术,突破了现有方法在通量和多重性上的限制,为解析细胞分化、扰动响应和疾病中的复杂基因调控网络提供了有力工具。其在巨噬细胞极化、T 细胞分化和 CRISPR 筛选中的应用,不仅揭示了转录因子动态调控的新机制,还建立了非编码区遗传变异与疾病表型的直接联系。该技术有望加速大规模细胞图谱构建和药物筛选,推动发育生物学、免疫学和精准医学领域的发展。未来,SUM-seq 的多组学扩展潜力(如结合蛋白质组、甲基化组)将进一步提升其在复杂生物系统研究中的应用价值。