CRISPR-Cas9 技术靶向剔除非可变 RNA 改善单细胞测序数据质量,助力低成本高效研究

【字体: 时间:2025年05月21日 来源:Genomics & Informatics

编辑推荐:

  在 scRNA-seq 中,非可变 RNA(如核糖体、线粒体 RNA)高表达影响数据质量,现有计算方法(如 SoupX)存在局限。本研究利用 CRISPR-Cas9 技术选择性剔除这类 RNA,在 17 例 IBD 患者肠组织数据中显著降低目标基因表达,且半测序深度下保持数据质量,为优化 scRNA-seq 提供新策略。

  
在生命科学研究领域,单细胞 RNA 测序(scRNA-seq)技术如同一位 “显微镜下的摄影师”,能捕捉单个细胞的基因表达图谱,为解析细胞异质性和复杂生物学过程提供了强大工具。然而,这一技术在应用中面临着一个棘手的 “噪音干扰”—— 某些器官或组织样本中,非可变 RNA(如核糖体 RNA、线粒体 RNA 等)的高表达常常占据测序数据的主导地位,不仅掩盖了低丰度基因的信号,还可能干扰细胞类型鉴定、基因共表达网络分析等关键环节。例如在肠组织等富含 RNase 的环境中,RNA 降解产生的碎片会混入单细胞液滴,进一步加剧背景噪音,导致传统的计算方法(如 SoupX)难以高效且精准地剔除干扰信号,甚至可能误删生物学相关数据。如何在不损失关键信息的前提下,有效降低非可变 RNA 的干扰,同时减少测序成本,成为困扰研究者的重要问题。

为突破这一瓶颈,首尔国立大学医学院(Seoul National University College of Medicine)的研究团队开展了一项创新研究。他们将目光投向了 CRISPR-Cas9 这一精准基因编辑工具,试图利用其特异性靶向切割的能力,在 scRNA-seq 的文库构建阶段直接剔除非可变 RNA 的 cDNA,从源头解决干扰问题。这项研究成果发表在《Genomics & Informatics》上,为 scRNA-seq 技术的优化提供了全新思路。

研究团队采用的关键技术方法包括:

  1. 样本采集与处理:收集 17 例炎症性肠病(IBD)患者的肠组织样本,通过酶消化法分离细胞,冻存后复苏清洗,进行单细胞悬液制备。
  2. CRISPR-Cas9 靶向剔除:在文库构建过程中,利用 DepleteX 试剂盒中的 Cas9 核糖核蛋白复合物(RNP)结合靶向核糖体、线粒体等非可变基因的向导 RNA(gRNA),对 cDNA 进行特异性切割剔除。
  3. 单细胞测序与数据分析:使用 10X Genomics Chromium 平台进行单细胞文库构建,分别对处理组(25,000 reads/cell)和未处理组(50,000 reads/cell)进行测序,通过 Cell Ranger、Seurat 等工具进行数据预处理、细胞聚类、差异表达分析等,并与 SoupX 计算方法进行对比。

3.1 CRISPR-Cas9 精准剔除线粒体和核糖体 RNA


通过对比原始数据、SoupX 处理数据和 CRISPR-Cas9 处理数据,研究发现:CRISPR-Cas9 能几乎完全剔除核糖体 RNA 和线粒体 RNA 的表达,而 SoupX 仅能部分降低其表达水平。从基因剔除范围看,CRISPR-Cas9 成功剔除 77 个非可变基因,显著多于 SoupX 的 19 个,且能靶向 EEF1A1、MALAT1 等计算方法难以处理的基因。尽管 CRISPR-Cas9 处理组的测序深度仅为未处理组的一半,但两组在测序饱和度、单细胞检测基因数和细胞回收率等指标上无显著差异,证明该技术可在降低测序成本的同时维持数据质量。

3.2 数据完整性与生物学结果的一致性


进一步分析显示,CRISPR-Cas9 处理组与原始数据在细胞类型组成(如浆细胞、上皮细胞、T/NK 细胞等八大类群)和 T/NK 细胞亚群分布上均无显著差异,UMAP 可视化和细胞频率分析表明两组数据高度整合,未出现批次效应。在基因表达层面,除靶向剔除的非可变基因外,其他基因的表达模式在两组间保持一致,GO 通路分析显示 T/NK 细胞亚群的功能富集结果完全吻合,证实该技术未对生物学信息造成干扰。

3.3 靶向效率与潜在应用价值


研究发现,尽管 CRISPR-Cas9 对预设的 352 个非可变基因的整体剔除效率低于 30%,但核心目标基因(核糖体和线粒体 RNA 相关基因)的剔除效果显著,且未检测到脱靶效应或非预期基因删除。此外,处理后的数据在半测序深度下仍能保留完整的生物学信号,为大规模单细胞测序研究提供了经济高效的解决方案,其应用场景可延伸至批量 RNA 测序和空间转录组学等领域。

研究结论与讨论
本研究首次通过实验证实,CRISPR-Cas9 技术在 scRNA-seq 中可高效、精准剔除非可变 RNA,相较于传统计算方法具有更高的特异性和基因剔除效率,且能在降低测序成本的同时维持数据质量和生物学完整性。这一技术尤其适用于肠组织等非可变 RNA 高表达的样本类型,为解析复杂组织的单细胞转录组提供了新工具。尽管存在靶向效率限制和对特定基因依赖 gRNA 设计的局限性,但其在成本控制和数据优化方面的优势,有望推动单细胞测序技术在大规模疾病研究、细胞图谱绘制等领域的应用。未来研究可进一步优化 gRNA 组合,拓展其在不同组织和研究场景中的适用性,为单细胞生物学研究开辟更广阔的空间。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号