
-
生物通官微
陪你抓住生命科技
跳动的脉搏
空间感知图Transformer框架SpaGT:整合空间与转录组信息解析组织异质性的新范式
【字体: 大 中 小 】 时间:2025年04月07日 来源:Communications Biology 5.2
编辑推荐:
编辑推荐:本研究针对空间转录组技术(SRT)数据存在的高噪声和空间信息整合不足等挑战,开发了基于结构强化自注意力机制的空间感知图Transformer框架SpaGT。通过同时建模节点和边通道,实现了基因表达去噪和空间功能域识别,在17个跨平台数据集上验证了其优越性能,为肿瘤异质性研究和预后标志物发现提供了新工具。
针对这些挑战,来自杭州研究院等机构的研究团队在《Communications Biology》发表了创新性研究成果。他们开发的SpaGT框架通过结构强化自注意力机制,成功实现了空间信息与转录组数据的深度融合。该框架创新性地采用多头自注意力模块替代传统图卷积,通过边通道嵌入空间拓扑结构信息,使模型能够同时学习全局关联和局部空间特征。这种设计不仅克服了现有方法的局限性,还为SRT数据分析提供了全新的解决方案。
关键技术方法包括:1) 基于k近邻的空间图构建,将多模态数据转化为加权图结构;2) 表达增强模块通过可调参数α控制空间邻域信息整合强度;3) 结构强化自注意力模块整合节点和边通道信息;4) 基于奇异值分解(SVD)的位置编码;5) 聚类增强对比学习模块优化空间域识别。研究使用了来自10x Visium、Slide-seqV2等平台的17个数据集进行验证,包括人类背外侧前额叶皮层(DLPFC)、三阴性乳腺癌等样本。
在"SpaGT在空间域识别中的卓越效能"部分,研究团队在12个人类DLPFC切片上的测试显示,SpaGT以0.572的中位调整兰德指数(ARI)显著优于STAGATE(0.485)等对比方法。特别在切片151672上达到0.805的ARI,其识别结果与人工标注的皮层分层结构高度吻合。消融实验证实边通道对性能提升至关重要,移除后ARI下降20%。
"SpaGT揭示单细胞分辨率SRT数据中的解剖结构"展示了模型在更高分辨率数据中的适用性。在osmFISH小鼠体感皮层数据中,SpaGT以0.632的ARI准确识别出各皮层亚区;在Seq-Scope平台的小鼠肝脏数据中,其空间域划分与已知解剖结构的一致性远超其他方法。
特别引人注目的是"SpaGT揭示三阴性乳腺癌异质性的生物学见解"部分。在低白蛋白型(CL)肿瘤样本中,SpaGT成功区分出5个功能区域(ARI=0.332),显著改善了肿瘤-间质边界识别。通过表达去噪分析发现,YBX1和UBE2C等基因在肿瘤区域的特异性表达显著增强(log2FC分别从2.084/2.546提升至3.782/3.671),这些基因与肿瘤增殖、耐药性密切相关,经独立临床数据验证具有显著预后价值。
在"SpaGT精准识别高分辨率SRT平台的解剖结构"部分,Stereo-seq小鼠胚胎数据(5,913个点)的分析显示,SpaGT能准确识别肝脏、心脏等器官(ARI=0.344);Slide-seqV2小鼠海马数据(41,786个点)中,其识别的CA2、CA3等亚区与Allen脑图谱高度一致,并通过S100b等标记基因的表达模式得到验证。
讨论部分指出,SpaGT的创新性体现在三个方面:首先,其结构强化自注意力机制突破了传统GNN的局部感受野限制,实现了全局与局部信息的动态平衡;其次,框架设计具有平台普适性,可处理从单细胞到多细胞分辨率的各类SRT数据;最后,通过整合空间拓扑信息进行表达增强,显著提升了生物标志物的发现能力。尽管当前版本尚未整合基因调控网络信息,但研究者指出这将是有价值的拓展方向。
这项研究为空间转录组数据分析设立了新标准,其开发的SpaGT框架不仅解决了现有方法的关键局限,更为探索组织发育、肿瘤微环境等重大生物学问题提供了强大工具。特别是通过空间表达去噪和精细域识别能力,为癌症等复杂疾病的精准分型和治疗靶点发现开辟了新途径。
生物通微信公众号
知名企业招聘