《Cell Genomics》:Empowering integrative and collaborative exploration of single-cell and spatial multimodal data with SGS genome browser
编辑推荐:
推荐阅读:本文介绍了单细胞和空间基因组学系统(SGS),它是一款用于可视化单细胞和空间多模态数据的工具。SGS 可整合复杂多模态数据,支持多种数据格式,具备 3D 转录组数据可视化等功能,为研究细胞异质性等提供有力支持。
### 研究背景
随着单细胞和空间多组学(scMulti-omics)技术的发展,大量复杂、高维的多组学数据不断涌现。这些数据包含 RNA 表达、蛋白质丰度、DNA 甲基化等多种信息,对研究基因调控、细胞间相互作用等生物学过程意义重大,但也给数据可视化带来了挑战。现有的可视化工具,如 Cellxgene、UCSC Cell Browser 等,在处理多模态数据时存在局限性,难以满足科研人员深入分析数据的需求,因此亟需开发新的可视化工具。
SGS 的设计
SGS 是基于图形用户界面(GUI)的可视化工具,用于高维单细胞和空间组学数据的整合与协作可视化。它采用 Docker 技术,结合 Flutter 和 Flutter 框架,实现了前后端分离。通过内存映射、数据分块和缓存技术,SGS 能够高效解析和渲染数据。同时,设计了自适应通信机制,增强了单细胞和基因组浏览器面板之间的协同可视化能力。
SGS 的优势
统一界面与多模态整合 :SGS 提供统一界面,可可视化基因组学、转录组学、蛋白质组学和表观基因组学等数据,涵盖单细胞和空间分辨率。相比现有工具,如 Vitessce,SGS 在可视化能力、交互性、视图协调、多用户协作和易用性方面更具优势。
增强的可访问性与协作性 :无需编程,研究团队就能快速搭建可视化和共享平台,进行数据探索、共同注释、评论和项目管理。
多模态整合与协调可视化 :SGS 有 SC 和 SG 两种模式。SC 模式用于基于表达的 scMulti-omics 数据比较探索;SG 模式整合基因组浏览器框架和单细胞组件,增强了表观基因组模态的可视化。通过自适应通信机制,实现不同面板间多模态数据集的同步探索。
3D SRT 数据可视化 :SGS 提供交互式、可共享的 3D SRT 数据浏览器,优于现有工具。用户可通过表面模型图交互式浏览 3D 数据,探索基因表达异质性。
比较可视化功能 :SGS 的 scCompare、scMultiView 和双染色体模式等功能,方便对多模态数据的细胞异质性、基因表达和基因组映射信号进行比较可视化。
兼容性强 :支持多种数据格式,如 AnnData、MuData、Zarr 等,还提供 SgsAnnData R 包进行格式转换,可与 Seurat、ArchR 等分析工具兼容。
SGS 的主要功能
用户友好性提升 :SGS 是高度用户友好的跨平台 GUI 可视化软件,利用 Docker 和 Flutter 技术实现图形化一键安装,避免复杂配置和部署,支持多种数据格式的批量上传,降低了使用门槛。
多用户协作功能 :支持实时协作,多用户可对同一数据集进行细胞类型注释、基因组特征重命名等操作;能无缝共享视图会话或 URL;具备先进的项目和用户管理系统,可有效管理多项目、多物种研究,分配不同用户权限。
单细胞和空间组学数据可视化
SC 可视化模式 :适用于比较探索基于表达的 scMulti-omics 数据。支持嵌入图(如 UMAP 或 t-SNE 生成)和组织切片可视化,可叠加注释元数据。scCompare 和 scMultiView 功能分别用于比较特定细胞类型注释和基因表达,以及提供多种可视化选项进行多特征比较。此外,还具备 3D 转录组数据可视化能力,方便研究胚胎发育等过程中的基因表达模式。
SG 可视化模式 :用于处理单细胞和空间表观基因组学数据。开发了新颖的基因组浏览器框架,支持多种轨道可视化,包括基因结构、基因组变异位点等。双染色体可视化模式可用于比较表观基因组信号,多面板自适应通信机制实现了单细胞和基因组浏览器面板的协同可视化,便于深入理解分子间动态关系。
用户案例
sn-m3C-seq 数据可视化 :SGS 可同步可视化人类前额叶皮层(PFC)和海马体(HPC)发育过程中 sn-m3C-seq 数据,包括 DNA 甲基化和 3D 染色质构象信息。通过多面板整合和自适应通信,能在统一界面展示表观基因组映射信号和单细胞甲基化信息,为研究大脑发育的表观遗传调控提供了有力工具。
10x Genomics Visium 多样本数据可视化 :利用 SGS 的 scCompare 功能,可对小鼠大脑前后部的 10x Genomics Visium 多样本数据进行比较可视化,观察细胞分布和基因表达模式的差异,有助于深入了解组织中基因表达的空间异质性。
sc-eQTL 数据可视化 :SGS 可展示 OneK1K 研究中的 sc-eQTL 数据,通过基因组浏览器和单细胞可视化组件的协同工作,帮助研究人员探索基因调控对细胞功能和疾病机制的影响。
Spatial-ATAC-seq 数据可视化 :SGS 可对小鼠胚胎发育过程中的 Spatial-ATAC-seq 数据进行综合可视化,帮助研究人员观察目标基因的表观遗传信号和空间表达差异,了解基因调控和表达模式。
3D SRT 数据可视化 :利用 SGS 的 scCompare 功能展示果蝇晚期胚胎的 3D SRT 数据,用户可通过表面模型观察不同组织区域,搜索标记基因了解其空间表达模式,为研究胚胎发育提供了新视角。
讨论
研究综述 :SGS 为 scMulti-omics 数据的联合可视化提供了统一界面,具有图形化安装、支持多种数据类型可视化、多模态比较等优势,其独特的基因组框架和面板同步设计有助于深入分析数据。
研究局限性与展望 :随着新的 scMulti-omics 数据集不断涌现,SGS 面临多模态数据集成的挑战,如批次效应、数据异质性等。未来将采用多种集成策略应对这些挑战,并优化成像 - based 空间转录组数据的渲染,以适应空间测序技术的发展。
资源可用性
SGS 的代码可在 GitHub 和 Zenodo 上获取,相关数据可从多个公共数据库获取,还提供了教程帮助用户使用 SGS。
鎵撹祻
涓嬭浇瀹夋嵎浼︾數瀛愪功銆婇€氳繃缁嗚優浠h阿鎻ず鏂扮殑鑽墿闈剁偣銆嬫帰绱㈠浣曢€氳繃浠h阿鍒嗘瀽淇冭繘鎮ㄧ殑鑽墿鍙戠幇鐮旂┒
10x Genomics鏂板搧Visium HD 寮€鍚崟缁嗚優鍒嗚鲸鐜囩殑鍏ㄨ浆褰曠粍绌洪棿鍒嗘瀽锛�
娆㈣繋涓嬭浇Twist銆婁笉鏂彉鍖栫殑CRISPR绛涢€夋牸灞€銆嬬數瀛愪功
鍗曠粏鑳炴祴搴忓叆闂ㄥぇ璁插爞 - 娣卞叆浜嗚В浠庣涓€涓崟缁嗚優瀹為獙璁捐鍒版暟鎹川鎺т笌鍙鍖栬В鏋�
涓嬭浇銆婄粏鑳炲唴铔嬬櫧璐ㄤ簰浣滃垎鏋愭柟娉曠數瀛愪功銆�