基于因果感知图-Transformer深度学习的植物胁迫特异性转录调控解码

【字体: 时间:2025年08月07日 来源:Current Plant Biology 4.5

编辑推荐:

  本研究针对植物在非生物胁迫下转录因子(TF)条件特异性结合的识别难题,开发了CTF-BIND框架。通过整合23TB多组学数据(ChIP-seq/RNA-seq/PPI),构建贝叶斯因果网络和Graph-Transformer模型,实现了仅需RNA-seq数据即可预测110种胁迫相关TF的结合位点,准确率达93%。该研究为解析植物胁迫响应的时空动态调控网络提供了创新工具,发表在《Current Plant Biology》。

  

植物在自然环境中持续面临干旱、高温、盐碱等多种非生物胁迫,这些环境压力严重制约农作物产量。虽然已知转录因子(TF)通过结合顺式调控元件(CREs)介导胁迫响应,但传统技术如染色质免疫沉淀测序(ChIP-seq)成本高昂且无法捕捉动态调控过程。更关键的是,植物如何在不同胁迫条件下选择性激活特定TF-靶基因(TG)互作形成条件特异性基因调控网络(GRN),这一机制仍是植物生物学重大挑战。

针对这些瓶颈,中国科学院喜马拉雅高通量计算生物学中心(HiCHiCoB)的研究团队开发了CTF-BIND系统。这项创新研究整合23TB多组学数据,首次实现通过RNA-seq数据直接预测TF结合事件,相关成果发表在《Current Plant Biology》。研究人员采用三大关键技术:1) 基于46种胁迫条件的780个RNA-seq样本和490个ChIP-seq样本构建贝叶斯因果网络;2) 开发结合序列Transformer和Graph-Transformer的双模态深度学习架构;3) 建立包含110个胁迫相关TF的CTF-BIND-DB数据库。系统通过10折验证达到93%准确率,成功解析了植物胁迫响应的时空动态调控规律。

1. TF结合信息构成时空调控的因果网络基础

通过整合9.8TB ChIP-seq数据与PTFSpot预测,鉴定出DREB2B(783靶基因)、RAP2.9(465靶基因)等核心调控因子。贝叶斯网络分析显示96%的TF-TG组合具有强相关性(|r|≥0.8),构建了6,438个高置信度互作。

2. 贝叶斯网络解析功能性的TF-TG因果关联

时间序列分析揭示CBF3在冷胁迫T3时相激活,而HSFA2在热胁迫1小时即响应。DREB2A-NAC019等模块在干旱中调控112个脱水响应基因(GO:0009414),验证了ABA依赖与非依赖通路的汇聚。

3. 非生物胁迫响应中的因果调控路径

发现CBF-ICE1模块(ρ=0.92)主导冷适应,HSFA1-HSFA2(ρ=0.88)调控143个热激蛋白基因。DREB2A、HSP90等构成"共同路径",连接多种胁迫响应。

4. 条件特异性TF协同调控

鉴定43个协同TF对,如冷胁迫中CBF1-ICE1共调控68个基因(Jaccard指数0.45),热胁迫中HSFA4A-MBF1C管理氧化应激响应(GO:0034599)。

5. 因果网络赋能深度学习精准预测

Graph-Transformer整合序列k-mer特征与网络拓扑,在测试集达到92.51%准确率。Grad-CAM分析揭示WRKY33结合受WRKY25、MPK3等节点调控(评分>0.8)。

6. CTF-BIND-DB数据库实现调控网络可视化

平台包含11,556个条件特异性网络,如HSFA1在热胁迫中调控47个基因,显著富集"蛋白折叠"(GO:0006457)通路。

这项研究突破了传统ChIP-seq的技术局限,首次实现通过转录组数据重建时空动态的TF调控图谱。发现的17个新型胁迫调控因子(如NAC78、bZIP73)为作物抗逆育种提供了新靶点。CTF-BIND系统已部署为开放网络服务器,其创新性体现在:1) 将因果推理引入深度学习框架;2) 解析TF结合的条件依赖性;3) 建立植物胁迫响应的系统级调控模型。该成果不仅推进了对植物环境适应的认知,更为设计多胁迫耐受作物提供了精准调控工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号