编辑推荐:
单细胞基因组技术虽能对细胞进行多模态分析,但存在实验局限。研究人员开展 “mapping cells through time and space with moscot” 研究,开发出 moscot 框架。该框架可重构细胞发育轨迹等,为单细胞基因组分析带来新突破,助力深入理解细胞分化等过程。
在生命科学的微观世界里,细胞就像一个个神秘的小精灵,它们的分化和组织过程蕴含着无数生命的奥秘。单细胞基因组技术的出现,让科学家们能够深入到细胞内部,对其进行多模态的剖析,就像是拥有了一台超级显微镜,能够看清细胞的分子状态和空间组织。然而,这台 “显微镜” 也有它的局限。实验过程中,细胞往往会被破坏,而且只能捕捉到部分分子信息,这就好比在拼图游戏中,只拿到了部分拼图碎片,难以还原完整的画面。此外,现有的实验技术难以在细胞的自然动态和空间组织环境中进行全面测量,这使得我们对细胞的了解始终隔着一层 “迷雾” 。
为了拨开这层 “迷雾”,来自德国亥姆霍兹中心(Helmholtz Center)、慕尼黑工业大学(Technical University of Munich)等机构的研究人员展开了一项极具意义的研究。他们开发了一种名为多组学单细胞最优传输(multi-omics single-cell optimal transport,moscot)的可扩展框架,相关研究成果发表在《Nature》上。这项研究对于深入理解细胞的发育和组织过程,以及探索疾病的发生机制等方面都具有重要意义。
研究人员在这项研究中用到了多个关键技术方法。首先是单细胞测序技术,通过对单细胞的基因表达和染色质可及性等进行测序,获取细胞的分子信息。其次是最优传输(Optimal Transport,OT)算法,该算法被用于解决细胞映射和对齐问题,能够在不同的细胞数据集之间建立联系。此外,研究人员还运用了空间转录组学技术,用于分析细胞在空间上的基因表达模式 。
研究结果如下:
- 重建小鼠胚胎发育轨迹:研究人员运用 moscot.time 对包含近 170 万个细胞、20 个时间点的小鼠胚胎发育图谱进行分析。与传统方法相比,moscot.time 在处理大规模数据时优势明显,它能够在笔记本电脑上处理发育图谱,而传统方法 WOT 在处理少量细胞时就会耗尽内存。在准确性方面,moscot.time 与专门为该数据集设计的 TOME 方法相当,并且在预测细胞生长率和细胞命运方面表现更优 。
- 映射和对齐空间样本:moscot.space.mapping 在空间转录组数据分析中展现出强大的能力。在与其他方法的对比实验中,moscot 在 14 个数据集上均优于 Tangram 和 gimVI,能够更准确地将单细胞参考数据映射到空间坐标上,实现基因表达和蛋白质信息的空间定位。例如,在对小鼠肝脏样本的研究中,moscot 成功解决了肝脏生理学中识别中央静脉(CVs)和门静脉(PVs)的难题,通过整合多种模态信息,详细描绘了肝脏分区的组织微环境 。
- 绘制时空小鼠发育图谱:moscot.spatiotemporal 结合基因表达谱和物理距离推断细胞轨迹,在小鼠胚胎发生时空转录组图谱分析中,比仅基于基因表达信息的方法表现更出色,平均提高了 5%(相对于 moscot.time)和 13%(相对于 TOME)的注释转换分数。通过该方法,研究人员还识别出肝脏、心脏和大脑发育的驱动基因和靶基因,为理解器官发育机制提供了重要线索 。
- 描绘小鼠胰腺发育过程:利用 moscot.time 对小鼠胰腺发育过程中的单细胞和 ATAC 多组学数据进行分析,研究人员揭示了 delta 细胞和 epsilon 细胞的谱系关系。他们发现这两种细胞具有相似的发育轨迹,并且确定了 NEUROD2 是调节 epsilon 细胞形成的关键转录因子(TF)。通过在人类诱导多能干细胞(iPS)分化系统中的实验验证,进一步证实了 NEUROD2 在 epsilon 细胞分化中的重要作用 。
研究结论表明,moscot 为单细胞基因组学研究提供了一个强大的工具,它能够整合多模态信息,实现大规模数据集的分析,并且在时空分析方面具有独特的优势。通过 moscot,研究人员能够更准确地重建细胞分化轨迹,揭示细胞间的关系,识别关键的调控因子。这不仅有助于我们深入理解正常的生物学过程,如胚胎发育和组织形成,还为研究疾病的发生、发展机制提供了新的视角。例如,在胰腺内分泌细胞的研究中,对 delta 细胞和 epsilon 细胞谱系关系的揭示,可能为糖尿病等相关疾病的治疗提供新的靶点和思路。此外,moscot 作为开源软件,其广泛应用有望加速生命科学领域的研究进程,推动单细胞基因组学的进一步发展,让我们更加深入地探索生命的奥秘 。