
-
生物通官微
陪你抓住生命科技
跳动的脉搏
Gene2role:基于角色嵌入的基因调控网络比较分析方法揭示细胞状态动态调控新机制
【字体: 大 中 小 】 时间:2025年05月25日 来源:BMC Bioinformatics 2.9
编辑推荐:
研究人员针对当前基因调控网络(GRN)比较分析方法局限于简单拓扑信息的问题,开发了首个基于角色嵌入的签名网络基因表征方法Gene2role。该方法通过多跳拓扑相似性计算和分层图嵌入技术,成功捕捉了模拟网络、人工注释网络、单细胞共表达网络(scRNA-seq)和单细胞多组学网络(scATAC-seq/scRNA-seq)中基因的结构特征,识别出跨细胞状态的差异拓扑基因(DTG)并量化基因模块稳定性,为解析细胞状态转换的调控动态提供了新视角。
基因表达调控是维持细胞特性与分化的核心过程,其复杂性体现在由激活/抑制关系构成的基因调控网络(GRN)中。尽管单细胞测序(scRNA-seq)和多组学技术(scATAC-seq等)推动了大规模GRN构建,但现有比较分析方法仅关注基因的直接连接(如度中心性),难以捕捉多层级拓扑差异。东京大学的研究团队在《BMC Bioinformatics》发表研究,提出Gene2role方法,首次将角色嵌入框架(struc2vec/SignedS2V)应用于签名GRN分析,通过动态时间规整(DTW)量化基因多跳邻域相似性,结合Skip-Gram模型生成可比较的基因嵌入,揭示了传统差异表达分析(DEG)遗漏的调控动态。
关键技术包括:(1)基于符号度(signed-degree)+/-的零跳距离计算;(2)动态时间规整(DTW)对齐多跳邻域序列;(3)多层图构建与随机游走生成拓扑语境;(4)跨网络嵌入对齐识别差异拓扑基因(DTG);(5)Louvain算法量化基因模块稳定性。实验数据涵盖模拟网络、BEELINE数据库的4个人工注释网络(如造血干细胞HSC网络)、人胶质母细胞瘤单细胞数据及小鼠骨髓祖细胞多组学网络。
Gene2role捕获GRN拓扑信息
在模拟网络中,Gene2role将仅含单条负向连接的基因S9/S15聚类,而忽略符号的struc2vec错误分离了具有相似正向连接的cJun/EgrNab。多组学网络中,基因嵌入聚类显示:簇0富含正向度中心性基因,簇9则为负向连接枢纽,验证了方法对复杂拓扑的表征能力。
差异拓扑基因发现
在胶质母细胞瘤0-h/12-h阶段比较中,66个DTG中50个与DEG重叠(如增殖相关CD164),但16个基因(如DKK3)表达稳定而连接模式剧变。成熟CD4+T细胞中,PSTPIP2网络连接减少却无表达差异,提示传统分析可能遗漏功能重编程。
多细胞类型DTG分析
人外周血单核细胞(PBMC)10种细胞类型的整合网络发现33个DTG:FGFBP2在NK细胞中负向连接增多,而TNFRSF13B在B细胞中呈现枢纽特征。小鼠红细胞分化轨迹中,Gata1呈现周期性连接波动,与其已知的促分化功能一致。
基因模块稳定性
以0-h胶质瘤为锚点,模块5(胆固醇合成相关)在分化后拓扑距离和基因缺失率(NA%)均较高,而模块0(染色体分离相关)保持稳定。红细胞分化中,模块9(红细胞稳态)全程稳定,模块7(免疫调节)则发生显著重构。
该研究开创性地将结构嵌入引入GRN分析,揭示了基因角色变化与表达变异的非同步性,为理解细胞状态转换提供了拓扑视角。未来可扩展至空间转录组数据,但需解决基因跨网络连接缺失的量化难题。作者指出,随着GRN构建精度提升,Gene2role将推动更精细的调控动态解析。
生物通微信公众号
知名企业招聘