编辑推荐:
在空间组学研究中,现有计算方法难以区分细胞内在变异性和细胞间相互作用,影响对空间调控的理解。研究人员开展了 “SIMVI disentangles intrinsic and spatial-induced cellular states in spatial omics data” 的研究,提出 SIMVI 框架,能有效分离相关变量,在多数据集表现出色,为空间组学分析提供新工具。
空间组学技术的出现,让科学家们能够以前所未有的分辨率探索组织的奥秘。想象一下,通过这些技术,就像拥有了一台超级显微镜,能够深入到细胞层面,观察基因表达和相互作用的动态变化,了解它们与组织结构和功能之间的关系。然而,在这个看似光明的研究道路上,却存在着两大 “拦路虎”。一方面,相同类型的细胞常常在空间上聚集在一起,这使得基因表达的空间模式大多反映了细胞的内在属性,而非细胞间的空间相互作用;另一方面,不同类型的细胞对局部环境的反应各不相同,这让准确区分细胞内在变异性和细胞间相互作用变得难上加难。这两个问题就像两座大山,阻碍着科学家们对复杂生物过程的深入理解,比如在肿瘤研究中,无法精准把握肿瘤细胞的微环境变化机制,从而影响治疗方案的制定。
为了解开这些谜团,来自耶鲁大学(Yale University)的研究人员开展了一项重要研究。他们提出了一种名为空间相互作用建模变分推断(Spatial Interaction Modeling using Variational Inference,SIMVI)的深度学习框架,旨在解决现有方法的不足,深入剖析空间组学数据中的细胞状态。
研究人员在研究过程中,用到了几个主要关键的技术方法。首先是变分推断技术,用于近似后验分布以推断模型参数。通过构建特定的生成模型,将基因表达数据的生成过程与细胞的内在变异(z)和空间变异(s)相联系。同时,使用图注意力网络(Graph Attention Network,GAT)对空间变异进行建模,以捕捉细胞间的空间关系。在估计空间效应时,运用了原型分析(archetypal analysis)和线性回归方法,将空间变异转换为原型权重表示,进而评估空间位置对基因表达的影响 。研究使用了多个公开数据集,包括 MERFISH 人类皮层、Slide-seqV2 小鼠海马体等数据,还对新收集的 CosMx 黑色素瘤队列数据进行分析。
下面来看看具体的研究结果:
- SIMVI 有效分离变异:研究人员将 SIMVI 应用于 MERFISH 人类皮层和 Slide-seqV2 小鼠海马体数据集。通过定义批校正、细胞类型保留、层保留和局部生态位保留分数等指标评估其性能。结果显示,SIMVI 在所有任务中表现出色,在空间相关任务上精度更高。例如,在 MERFISH MTG/STG 数据集中,SIMVI 的内在变异保留了细胞类型结构并消除了批次效应,其空间变异区分了不同层和局部生态位;在 Slide-seqV2 小鼠海马体数据集中,SIMVI 能正确揭示皮层层和第三脑室区域的组织,而其他方法存在 “过度平滑” 现象。
- SIMVI 推断准确空间效应:利用原型分析和线性回归估计空间效应,研究人员在 MERFISH MTG 数据中确定了与皮层层和血管结构对应的原型,并识别出具有明显空间模式和高空间效应R2值的基因。以星形胶质细胞为例,SIMVI 在识别与空间相关的基因簇方面表现优异,且能有效过滤假阳性。在 Slide-seqV2 小鼠海马体数据中,虽然存在阳性条件可能被违反的情况,但 SIMVI 仍能识别出 V3 上区上调的基因,其空间效应可视化效果更清晰。
- SIMVI 揭示人类扁桃体 B 细胞动态:应用 SIMVI 分析 Slide-tags 人类扁桃体数据集,其内在变异捕获了不同细胞类型,空间变异划分出有生物学意义的生态位。聚焦于生发中心 B 细胞,SIMVI 成功注释了不同阶段,这些阶段呈现循环结构,且细胞的空间位置与基因表达状态存在复杂依赖关系,这有助于深入理解 B 细胞的成熟机制。
- SIMVI 揭示人类黑色素瘤的生态位和空间依赖性表观遗传状态:在空间多组学黑色素瘤数据集中,SIMVI 的内在变异更好地捕获了细胞类型异质性,空间变异描绘了更精细的微环境。通过空间效应分析,发现了受空间背景影响的基因。此外,扩展 SIMVI 空间效应估计程序到表观遗传空间效应推断,揭示了肿瘤 2 的两种不同状态,为肿瘤的表观遗传重编程研究提供了新证据。
- SIMVI 揭示队列黑色素瘤数据中的空间相互作用:分析新收集的 CosMx 黑色素瘤患者队列数据,SIMVI 的内在变异正确合并了相同亚型的肿瘤细胞,空间变异捕获了非肿瘤细胞的患者反应模式。对巨噬细胞的空间效应分析确定了四种状态,与患者预后相关。同时,发现配体 - 受体强度与基因空间效应之间存在不对称关系,揭示了肿瘤微环境中潜在的细胞相互作用机制。
在研究结论和讨论部分,SIMVI 作为一种强大的方法,首次实现了在空间组学数据中分离细胞内在和空间诱导的变异,并能在单细胞水平上进一步估计空间效应。通过对多个不同组织和平台的真实数据集的分析,SIMVI 为生物学研究提供了新的见解。在黑色素瘤研究中,它有助于理解肿瘤异质性和耐药机制;在免疫研究中,对生发中心 B 细胞动态的揭示有助于深入了解免疫反应过程。然而,SIMVI 也存在一定局限性,在低分辨率空间组学数据集应用时可能受限,可通过结合先进的反卷积方法和计算技术来解决。同时,目前的空间效应估计基于线性模型,未来可探索使用更先进的机器学习模型,但要注意模型过拟合和解释的复杂性问题。总体而言,随着高分辨率空间组学技术的快速发展,SIMVI 有望在空间组学研究领域发挥重要作用,为生命科学和健康医学研究开辟新的道路,助力科学家们更好地理解生命过程和攻克相关疾病。