Single-cell RNA-seq 数据存在普遍血液污染,Originator 工具来 “救场”

【字体: 时间:2025年03月12日 来源:Genome Biology 10.1

编辑推荐:

  研究人员针对 scRNA-seq 数据血液污染问题,开发 Originator 工具分离免疫细胞,提升数据质量。

  在生命科学研究中,单细胞 RNA 测序(scRNA-seq)技术为探索复杂组织的细胞奥秘打开了一扇窗。然而,在对复杂(如胎盘)或天然混合(如肿瘤)组织进行 scRNA-seq 数据分析时,却遇到了大麻烦。很多组织里都有血管,这就导致 scRNA-seq 数据常常混入血细胞,这些血细胞和组织中固有细胞的表达谱极为相似。在肿瘤研究里,准确区分肿瘤组织中的血液免疫细胞和组织驻留免疫细胞,对了解肿瘤微环境至关重要;在胎盘组织研究中,分离母体和胎儿细胞对于揭示两者之间的细胞和免疫差异也很关键。但目前却没有专门的工具来解决这个问题,这就像在航海时没有精准的导航仪,研究人员迫切需要一个有效的方法来提升数据质量,为后续研究铺平道路。
为此,美国密歇根大学(University of Michigan)的研究人员开展了一项研究,旨在开发一种新的计算框架,解决 scRNA-seq 数据的血液污染问题,并能区分不同遗传背景的细胞。他们的研究成果发表在《Genome Biology》上,为该领域带来了新的曙光。

研究人员主要运用了以下关键技术方法:一是利用多种公开的 scRNA-seq 数据集,涵盖肝脏、肺、胰腺、肾脏等多种器官的正常和肿瘤组织样本,以及胎盘组织样本等;二是采用 Originator 多模块框架,该框架基于组织与血液的差异以及遗传信息,对 scRNA-seq 数据进行预处理;三是借助 freemuxlet、Seurat 等工具和相关算法,进行细胞遗传起源的分离和免疫细胞的分类 。

下面来看看具体的研究结果:

  • Originator 框架的原理与流程:Originator 框架先对细胞进行标准的 scRNA-seq 预处理,包括质量控制(QC)、归一化、数据整合、聚类和细胞类型注释。接着,利用 scRNA-seq 读取的基因型信息差异,通过 freemuxlet 分离具有不同遗传起源的细胞。然后,以公开的全血 scRNA-seq 数据为参考,将免疫细胞按血液和组织驻留环境进行分离。经过这一系列操作后,就可以进行各种下游功能分析。
  • Originator 框架的性能验证:研究人员利用人工混合数据和真实数据集对 Originator 进行验证。在人工混合数据中,他们先去除 PBMC 和乳腺癌细胞系之间的批次效应,再用 Originator 进行分离,结果显示其分离效果极佳,AUC 达到 0.96,F-1 分数为 0.97,精度召回曲线下面积(AUCPR)为 0.96。在 Krishna 等人的数据集上,对 ccRCC 组织和 PBMC 进行处理,Originator 在去除血液污染方面表现出色,对 B 细胞、CD4 T 细胞、CD8 T 细胞和 NK 细胞的平均 F 分数分别达到 0.98、0.93、0.91 和 0.99 。
  • 血液免疫细胞在组织样本中的普遍存在:应用 Originator 对多个公开的 scRNA-seq 数据集分析发现,大多数组织样本中的免疫细胞主要来自血液,而非组织微环境。这一结果表明,如果不去除这些血液免疫细胞,可能会导致研究结果出现偏差。
  • 血液免疫细胞污染对下游分析的影响:以胰腺导管腺癌(PDAC)的 scRNA-seq 数据集为例,Originator 成功分离出血液和肿瘤组织中的免疫细胞。通过差异表达(DE)分析发现,血液和肿瘤组织中的免疫细胞在基因表达上存在显著差异。例如,肿瘤组织中 T 细胞的 CCL4 和 CCL5 表达更高。基因集富集分析(GSEA)显示,Toll 样受体(TLR)信号通路和 NOD 样受体信号通路在组织驻留 T 细胞和巨噬细胞中更活跃,而自然杀伤细胞介导的细胞毒性信号通路在肿瘤 NK 细胞中下调。此外,去除血液免疫细胞后,肿瘤组织中细胞间通讯(CCC)也发生了变化,MIF 信号通路相关的细胞间相互作用明显减弱,这表明血液免疫细胞污染会对肿瘤组织的功能解读产生重要影响。
  • 胎盘组织中细胞的分离与分析:研究人员将 Originator 应用于胎盘组织,成功分离出胎儿和母体来源的细胞以及血液和胎盘驻留细胞。通过分析发现,胎儿来源的细胞占大多数,并且框架能正确地将滋养层细胞分配到胎儿组织。对胎儿和母体组织中常见细胞类型的 DE 分析和 GSEA 发现,两者在基因表达和信号通路富集方面存在显著差异,细胞间通讯也有所不同,这有助于深入了解胎盘的分子机制。

研究结论和讨论部分指出,Originator 是首个专门用于解读异质组织中 scRNA-seq 数据的系统工具,它能够有效去除 scRNA-seq 数据中不需要的血细胞,还能基于遗传背景提供更准确的细胞类型注释和下游功能分析。未来,研究人员将致力于构建无血液污染免疫细胞的泛组织免疫细胞图谱,以便更真实地注释目标组织中的驻留免疫细胞。这一研究成果为生命科学和健康医学领域的研究提供了有力的工具,有望推动相关领域的进一步发展,帮助人们更好地理解疾病机制,为疾病的诊断和治疗提供新的思路和方法。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号