空间转录组学新算法 Crescendo:精准校正批次效应,解锁基因表达奥秘

【字体: 时间:2025年02月26日 来源:Genome Biology 10.1

编辑推荐:

  为解决空间转录组学中批次效应影响基因表达分析的问题,研究人员开展 Crescendo 算法相关研究,结果显示该算法可有效校正批次效应,助力相关分析,意义重大。

  

空间转录组学(Spatial transcriptomics)技术的出现,就像是给科学家们配备了一台微观世界的 “导航仪”,让他们能够深入探索细胞在其空间解剖背景下的基因表达情况,这对于揭示细胞的功能、细胞间的相互作用以及组织器官的发育机制等方面具有重要意义。想象一下,细胞就如同一个个微小的 “工厂”,每个工厂都在进行着独特的 “生产活动”,而基因表达就是这些 “生产活动” 的 “指令”。通过空间转录组学,科学家们能够看到这些 “指令” 在不同细胞中的执行情况,以及它们在空间上的分布规律。

然而,在实际研究过程中,一个 “捣乱分子”—— 批次效应(Batch effects)却给科学家们带来了不少麻烦。它就像一层 “迷雾”,阻碍了科学家们清晰地观察基因的空间模式,使得不同样本之间的基因表达数据难以进行准确的比较和分析。比如,在研究肿瘤组织的空间转录组时,批次效应可能会导致原本在不同样本中表达模式相似的基因,看起来却差异很大,这就容易让研究人员得出错误的结论。此外,许多基因的测量数据存在稀疏或捕获不足的情况,而且有些基因可能在物理空间中并不聚集在一起表达,这些问题都使得有效可视化基因表达变得极具挑战性。


为了驱散这层 “迷雾”,来自相关研究机构的研究人员展开了深入的研究,他们提出了一种名为 Crescendo 的算法,旨在从基因表达水平上校正批次效应,实现跨多个样本的基因表达模式的准确可视化。

研究人员在这项研究中运用了多种技术方法。首先,通过模拟基因计数分布,为后续研究提供了大量的模拟数据基础;利用 Vizgen 小鼠脑受体图谱数据集、Vizgen 免疫肿瘤 FFPE 数据集以及结直肠癌(CRC)的 scRNA-seq 和空间转录组数据集等多种样本队列,进行不同层面的分析;还开发了批次方差比(Batch-Variance Ratio,BVR)和细胞类型方差比(Cell-Type Variance Ratio,CVR)等评估指标,用于量化基因表达批次校正的性能;通过计算空间交叉相关指数(Spatial Cross-Correlation Index,SCI)来评估基因间的空间相关性。

在研究结果方面:


  • Crescendo 校正跨数据集基因表达的批次变异:Crescendo 算法是 Harmony 算法的扩展,它直接对基因表达计数进行批次校正,输入基因计数矩阵、细胞类型和批次信息,输出校正后的矩阵。通过模拟基因表达数据计算 BVR 和 CVR,发现 Crescendo 能显著降低批次效应,且多数基因 CVR≥0.5,表明其在去除批次效应的同时能较好地保留细胞类型差异。

  • Crescendo 校正全小鼠脑连续切片的批次效应:研究人员使用 Vizgen MERSCOPE 平台的小鼠脑空间转录组数据集,分析 Crescendo 对特定基因(如 Gpr34、Rxfp1 和 Epha8)的作用。结果显示,该算法可改善基因可视化,使基因表达在不同切片间更一致。对所有 483 个基因的分析表明,Crescendo 在去除批次效应和保留生物变异方面表现优于其他算法。

  • Crescendo 可高效扩展到数百万个细胞:随着单细胞数据集规模不断扩大,计算效率至关重要。研究人员利用 Vizgen MERSCOPE 平台的免疫肿瘤 FFPE 数据集进行测试,发现 ComBat-Seq、Seurat 和 MNN 因内存需求无法完成 500 个基因的批次校正,limma 耗时 6.6 小时,而 Crescendo 仅用 3.3 小时。进一步实验表明,Crescendo 能在 7 分钟内校正 700 万个细胞中的 50 个基因,展现出良好的可扩展性。

  • Crescendo 通过整合配对数据集校正技术效应:研究人员整合 CRC 的 scRNA-seq 和空间转录组数据集,发现 Crescendo 可校正技术批次效应,提高基因在不同技术平台间表达的一致性,如使 MS4A1 和 CD3D 基因在空间切片中的表达更接近 scRNA-seq 数据,且在 BVR 和 CVR 指标上表现出色。

  • 批次校正有助于识别空间配体 - 受体相互作用:研究人员通过计算 SCI 评估 Crescendo 对检测基因 - 基因相互作用的影响。结果发现,对于部分配体 - 受体对(如 JAG2-NOTCH3 和 CCR3-CCL11),Crescendo 校正后 SCI 增加,能更好地展示基因共定位模式,有助于发现潜在的细胞间相互作用。


在结论与讨论部分,Crescendo 算法能够有效去除空间转录组数据中绝大多数基因的批次效应,这不仅使得基因表达在不同批次间的可视化效果得到显著提升,有助于研究人员更清晰地观察基因的空间模式,还为后续的基因共定位分析、配体 - 受体相互作用研究等下游分析提供了有力支持。同时,Crescendo 具有良好的可扩展性,能够处理现代大规模单细胞空间转录组数据集和单细胞图谱中的数据。不过,该算法也存在一些局限性,例如对于在所有批次中表达极低的基因,批次校正无法提升其表达;基于荧光原位杂交(FISH)的空间数据集的细胞分割存在挑战,不准确的分割可能影响批次校正效果;算法本身也存在无法填补批次中缺失基因、参数估计可能不准确以及对小样本量敏感等问题。尽管如此,Crescendo 算法在空间转录组学研究领域仍然具有重要的意义,为相关研究开辟了新的道路。


综上所述,Crescendo 算法为空间转录组学研究提供了一种强大的工具,有望推动该领域的进一步发展,帮助科学家们更好地理解细胞的奥秘,探索生命的本质。该研究成果对于生命科学和健康医学领域的发展具有重要的参考价值,可能为疾病的诊断、治疗以及药物研发等方面提供新的思路和方法。


主要技术方法:模拟基因计数分布,使用多个样本队列,开发 BVR、CVR 评估指标,计算 SCI。


娑撳娴囩€瑰宓庢导锔炬暩鐎涙劒鍔熼妴濠団偓姘崇箖缂佸棜鍎禒锝堥樋閹活厾銇氶弬鎵畱閼筋垳澧块棃鍓佸仯閵嗗甯扮槐銏狀洤娴f洟鈧俺绻冩禒锝堥樋閸掑棙鐎芥穱鍐箻閹劎娈戦懡顖滃⒖閸欐垹骞囬惍鏃傗敀

10x Genomics閺傛澘鎼isium HD 瀵偓閸氼垰宕熺紒鍡氬劒閸掑棜椴搁悳鍥╂畱閸忋劏娴嗚ぐ鏇犵矋缁屾椽妫块崚鍡樼€介敍锟�

濞嗐垼绻嬫稉瀣祰Twist閵嗗﹣绗夐弬顓炲綁閸栨牜娈慍RISPR缁涙盯鈧鐗哥仦鈧妴瀣暩鐎涙劒鍔�

閸楁洜绮忛懗鐐寸ゴ鎼村繐鍙嗛梻銊ャ亣鐠佹彃鐖� - 濞e崬鍙嗘禍鍡毿掓禒搴n儑娑撯偓娑擃亜宕熺紒鍡氬劒鐎圭偤鐛欑拋鎹愵吀閸掔増鏆熼幑顔垮窛閹貉傜瑢閸欘垵顫嬮崠鏍掗弸锟�

娑撳娴囬妴濠勭矎閼崇偛鍞撮摂瀣鐠愩劋绨版担婊冨瀻閺嬫劖鏌熷▔鏇犳暩鐎涙劒鍔熼妴锟�

相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 急聘职位
    • 高薪职位

    知名企业招聘

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号