
-
生物通官微
陪你抓住生命科技
跳动的脉搏
深度学习引导的大肠杆菌核心启动子可编程设计:从序列架构到强度调控
【字体: 大 中 小 】 时间:2025年09月05日 来源:Nucleic Acids Research 13.1
编辑推荐:
本研究针对大肠杆菌核心启动子(core promoter)强度预测与设计的难题,开发了整合突变-条形码-反向测序(MBRS)技术的高通量平台,构建了包含112,955个变体的合成启动子库,并基于Transformer模型(R=0.87)和条件扩散模型实现了启动子强度的精准预测(R=0.95)与从头设计。该工作为合成生物学提供了模块化、可扩展的转录调控工具,相关平台已开源(www.yudenglab.com)。
基因表达调控是合成生物学的核心挑战,而启动子作为转录起始的"开关",其强度控制直接决定代谢通路的效率。尽管大肠杆菌σ70型启动子的-10/-35框(box)和间隔区(spacer)特征已被解析,但传统方法难以预测其非线性序列-功能关系。现有机器学习模型存在泛化性差、数据集局限等问题,而随机突变库又面临冗余度高、功能覆盖率低的困境。
为解决这些难题,江南大学Zhou Xuan等开发了闭环工作流程:首先通过突变-条形码-反向测序(MBRS)技术构建包含112,955个变体的合成启动子库,覆盖16,226倍表达范围。分析发现保守区(-10/-35框)通过RNA聚合酶(RNAP)结合能主导强度变异(贡献率50.25%),而间隔区通过DNA刚性(46-51 nm最优)实现精细调控。基于此,研究团队建立了Transformer预测模型(Pearson R=0.87),其注意力机制(attention mechanism)揭示间隔区对强度调控的关键作用。
关键技术包括:
MBRS技术组合设计-35框(252种)、-10框(117种)和随机化间隔区,通过条形码关联mRNA/DNA测序数据
构建pSC101质粒系统,采用RiboJ绝缘子和BCD2 RBS(核糖体结合位点)稳定表达
条件扩散模型(conditional diffusion model)按8个强度等级生成新启动子,结合Transformer反向筛选
主要结果:
质粒系统优化
通过引入RiboJ绝缘子和标准BCD2 RBS,将表达变异系数降至0.065。采用PL308启动子控制RFP内参,实现稳定表达(CV=0.046)。
区域功能解析
-10/-35框组合主导强度变化(ANOVA P<0.01),其RNAP结合能与强度呈负相关(R=-0.75)。间隔区刚性分析显示46-51 nm区域富集于高活性启动子。
生成模型验证
条件扩散模型生成启动子的实测强度与目标强度相关性达0.93,显著优于WGAN-GP模型。Transformer预测生成序列的强度R值达0.95。
应用验证
设计的8个梯度强度启动子(P1-P8)在6种侧翼序列中保持强度等级(R=0.93)。中强度启动子(P4-P6)优化葡萄糖酸诱导系统,使泄漏表达降低同时动态范围提升3倍。
该研究首次实现大肠杆菌核心启动子的端到端设计,其模块化平台可扩展至其他调控元件(如UP元件、TFBS)。通过揭示保守区与间隔区的协同调控机制,为合成生物学提供了精准转录调控工具。值得注意的是,条件扩散模型展现出超越训练数据的设计能力,生成的启动子强度分布更均衡(28.6%强度>2.5 vs 原始库15.3%)。研究建立的www.yudenglab.com平台已实现设计-预测-验证闭环,相关方法发表于《Nucleic Acids Research》。
生物通微信公众号
知名企业招聘