-
生物通官微
陪你抓住生命科技
跳动的脉搏
SOAPy:解码空间组学微环境的Python利器——从分子动态到细胞互作的整合分析平台
《Genome Biology》:SOAPy: a Python package to dissect spatial architecture, dynamics, and communication
【字体: 大 中 小 】 时间:2025年03月30日 来源:Genome Biology 10.1
编辑推荐:
《Genome Biology》编辑推荐:空间组学技术虽能揭示组织微环境异质性,但缺乏系统分析工具。中科院上海营养与健康研究所团队开发了Python包SOAPy,集成空间域识别(STAGATE/GraphST)、张量分解(CP/Tucker)、细胞互作模型(Affinity-Strength评分)等算法,成功解析了乳腺癌(TNBC)、胚胎发育等多场景数据,首次实现接触型(COL1A1-ITGA1/ITGB1)与分泌型(VEGFB-FLT1)配受体对的差异化空间建模,为肿瘤免疫(TLS)和器官发育研究提供新范式。
在生命科学领域,空间组学技术(Spatial Omics)正掀起一场研究革命。这项被《Nature Methods》评为"年度技术"的方法,能够同时获取组织中分子的表达信息和空间坐标,就像给细胞绘制"分子地图"。然而,随着数据维度的爆炸式增长(如10X Visium的55-μm分辨率点阵、MIBI-TOF的亚细胞级蛋白成像),研究者们面临新的挑战:如何从海量空间数据中提取有生物学意义的模式?现有工具如Giotto、Squidpy等多专注于单一分析任务,缺乏对微环境动态(如发育时序)和细胞互作机制(如膜结合型vs分泌型配体)的系统整合。
针对这一瓶颈,中国科学院上海营养与健康研究所的李宏团队开发了SOAPy(Spatial Omics Analysis in Python)。这个创新性工具包通过四大模块——数据预处理、分子空间动态、细胞空间架构和空间通讯,首次实现了从基因表达趋势到多细胞生态位(multi-cellular niches)的全链条分析。研究团队在《Genome Biology》发表的论文中,展示了SOAPy如何通过张量分解(tensor decomposition)解析小鼠胚胎发育的时空规律,以及如何通过Affinity-Strength双指标模型精准识别三阴性乳腺癌(TNBC)中COL1A1-ITGA1/ITGB1等关键配受体对的空间互作模式。
关键技术方法包括:1)基于STAGATE和AUCell-LMI的空间域识别算法,处理来自10X Visium、MIBI-TOF等平台的7种公共数据集;2)采用CP/Tucker张量分解解析"时间-空间-基因"三维数据,如小鼠胚胎E9-E15四个发育阶段的心脏/肠道转录组;3)构建接触型(短距离)和分泌型(长距离)双模式细胞通讯网络,分析41例TNBC患者的211,649个单细胞蛋白互作;4)通过K-means聚类发现30类多细胞生态位(C-niche),其中B细胞主导的生态位与患者生存期显著相关。
研究团队通过封装STAGATE、GraphST和SCAN-IT三种无监督算法,在人类乳腺癌Visium数据中准确分离恶性区域(AUC>0.9)。更有创新性的是开发的AUCell-LMI方法,通过局部莫兰指数(Local Moran's I)量化已知标志基因(如TLS特征基因)的空间聚集性,比传统聚类更精准识别三级淋巴结构(tertiary lymphoid structures)。
在小鼠前额叶皮层(DLPFC)数据中,SOAPy的多元回归模型捕捉到Glul等基因的"低-高-低"非线性表达模式。通过距离依赖的LOESS回归,团队将2,857个显著基因(FDR<0.05)分为10类,其中C3簇(Hbb-bh1等)在白质附近高表达,而C7簇(Psd等)在皮层2层富集,与已知层状标记基因高度一致(Spearman ρ>0.8)。
对GeoMx DSP平台的小鼠胚胎数据(E9-E15)进行CP分解,发现7个特征因子:F1因子(Hbb-bh1)反映心/肺共发育早期特征;F7因子(Ndrg1)特异性表征中肠上皮E11-E15的发育轨迹。在肝脏再生数据中,Sds(PV区标志)和Col1a1(CV区48h标志)分别被F6和F1因子捕获,揭示了损伤后不同区域的时序响应差异。
MIBI-TOF数据显示,TNBC患者中CD4+ T细胞与CD8+ T细胞的邻域评分(Neighborhood Score)显著为正(P<1e-4),而上皮细胞与间质细胞的互作呈现患者异质性——样本28呈现"区室化"模式(IS=0.18),而样本29显示"混合"模式(IS=0.67)。
通过构建100像素半径的细胞网络,团队鉴定出30类C-niche。其中C-niche15(30%上皮细胞+23% CD4+ T细胞)高丰度患者中位生存期延长9个月(HR=0.41)。张量分解进一步将41例患者分为5组,B组(B细胞富集)和C组(间质细胞niche)的生存差异达统计学意义(log-rank P=0.02)。
在卵巢癌MERSCOPE数据(71,381细胞)中,SOAPy的创新模型区分了接触型(如COL1A1-ITGA1/ITGB1)和分泌型(如VEGFB-FLT1)互作。与CellChat相比,SOAPy将上皮细胞C3的假阳性互作降低83%,并通过强度阈值(Strength>4)过滤了虽空间显著但表达量低的噪音信号。
这项研究的意义在于:1)方法学上,首次将张量分解引入空间组学,解决了"时间-空间-样本"多维整合的难题;2)生物学上,通过双模式通讯模型证实VEGFB-FLT1等配受体对的跨区室作用,为抗血管生成疗法提供新靶点;3)临床转化方面,鉴定的B细胞生态位(C-niche10/17/28)可作为TLS形成的预测标志。正如作者在讨论中指出,SOAPy的模块化设计使其能持续整合多组学数据和人工智能算法,未来在器官再生和免疫治疗领域具有广阔应用前景。
10x Genomics闁哄倹婢橀幖顪渋sium HD 鐎殿喒鍋撻柛姘煎灠瀹曠喓绱掗崱姘姃闁告帒妫滄ご鎼佹偝閸モ晜鐣遍柛蹇嬪姀濞村棜銇愰弴鐘电煁缂佸本妞藉Λ鍧楀礆閸℃ḿ鈧粙鏁嶉敓锟�
婵炲棎鍨肩换瀣▔鐎n厽绁癟wist闁靛棗锕g粭澶愬棘椤撶偛缍侀柛鏍ㄧ墱濞堟厤RISPR缂佹稒鐩埀顒€顦伴悧鍝ヤ沪閳ь剟濡寸€n剚鏆╅悗娑欏姃閸旓拷
濞戞挸顑堝ù鍥Υ婵犲嫮鐭庨柤宕囧仜閸炴挳鎽傜€n剚顏ら悹鎰╁妺缁ㄧ増鎷呭⿰鍐ㄧ€婚柡瀣姈閺岀喎鈻旈弴鐘虫毄閻庢稒鍔掗崝鐔煎Υ閿燂拷
知名企业招聘
今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号