自动化与机器学习驱动恶臭假单胞菌异戊二烯醇产量的快速优化

《Nature Communications》:Automation and machine learning drive rapid optimization of isoprenol production in Pseudomonas putida

【字体: 时间:2025年12月14日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对代谢工程中难以解析复杂数据、高效优化产物产量的瓶颈,将实验室自动化与机器学习相结合,系统优化了恶臭假单胞菌(Pseudomonas putida)生产可持续航空燃料前体——异戊二烯醇(isoprenol)的过程。通过六轮设计-构建-测试-学习(DBTL)循环,利用CRISPR干扰(CRISPRi)技术同时下调多达四个基因靶点,使异戊二烯醇产量提高了5倍。机器学习从80万个可能组合中战略性地筛选出约400个优先构建体进行测试。高通量蛋白质组学验证了CRISPRi的下调效果并揭示了增产的生物学机制。该研究展示了ML驱动的自动化DBTL循环无需特定生物学知识即可快速提高产量,表明其可广泛应用于任何宿主、产品或途径的优化。

  
随着合成生物学的飞速发展,利用微生物细胞工厂生产高价值化学品已成为解决全球能源、环境和健康挑战的重要策略。然而,传统的代谢工程方法在优化微生物生产菌株时常常面临巨大挑战。解析复杂的代谢网络数据集以有效提高目标产物产量通常是一个缓慢且费力的过程,严重依赖研究人员的经验和直觉。开发一个高产菌株往往需要投入50到300人年以及1000万到1亿美元的成本,这极大地限制了生物制造产业的发展速度。
为了突破这一瓶颈,研究人员开始探索将先进的基因编辑工具、实验室自动化平台与机器学习算法相结合的新策略。其中,CRISPR干扰(CRISPR interference, CRISPRi)技术能够通过向导RNA(guide RNA, sgRNA)精确地下调特定基因的表达,从而实现对细胞代谢网络的精细调控。然而,当尝试同时下调多个基因(即多重CRISPRi)时,可能的基因组合数量会呈指数级增长,形成一个巨大到难以通过传统方法有效探索的设计空间。
在此背景下,一篇发表于《Nature Communications》的研究论文《Automation and machine learning drive rapid optimization of isoprenol production in Pseudomonas putida》报道了一项创新性工作。该研究团队成功地将实验室自动化、CRISPRi技术与机器学习驱动的主动学习(active learning)策略深度融合,建立了一个高效的设计-构建-测试-学习(Design-Build-Test-Learn, DBTL)循环平台,并将其应用于优化恶臭假单胞菌(Pseudomonas putida)生产异戊二烯醇(isoprenol)的能力。异戊二烯醇是一种重要的可持续航空燃料(sustainable aviation fuel, SAF)前体,其生物合成途径(特别是IPP-Bypass途径)涉及乙酰辅酶A(acetyl-CoA)、ATP和NADPH等关键细胞代谢物。
为开展此项研究,研究人员运用了几个关键的技术方法。他们构建了一个半自动化的实验流程,利用自动化液体处理工作站(如ECHO 550)、高通量微流控电转仪(HTME)和微型生物反应器(BioLector)进行CRISPRi质粒的组合构建、菌株转化和高通量发酵测试。研究使用了机器学习工具——自动化推荐工具(Automated Recommendation Tool, ART),基于先前周期的实验数据来预测和推荐可能提高产量的新sgRNA组合。此外,高通量全局蛋白质组学(proteomics)技术(基于DIA-NN的数据非依赖采集质谱分析)被用于验证CRISPRi对目标蛋白的下调效果,并深入理解其生物学机制。基因敲除(Knockout, KO)实验则被用来验证CRISPRi表型的特异性并探究潜在的脱靶效应(off-target effects)。
迭代CRISPRi阵列设计通过实验室自动化为有效的主动学习提供了大量高度可重复的数据
研究人员开发了一个半自动化流程,用于构建和筛选CRISPRi阵列,以生成主动学习所需的大量高重复性数据。该流程在总共6个DBTL周期(DBTL0-6)中,对472个独特菌株进行了三重重复实验,提供了精确的滴度和蛋白质组学数据,且对照菌株的滴度重复性极高。每个DBTL周期仅需2-3周即可完成。CRISPRi阵列能够同时下调位于正交代谢途径中的基因,以阐明哪些基因或基因组合有利于异戊二烯醇的生物生产。
异戊二烯醇生产和基因下调的快速表征提供了一组经过验证的CRISPRi基因靶点
DBTL0周期建立了一个可行的自动化工作流程,用于进行高通量CRISPRi评估,形成了一组合格的基因靶点库,后续将从中选择组合以提高滴度。研究人员扰动了120个独特基因,并确定了67个既影响异戊二烯醇滴度又能被CRISPRi有效下调的基因。通过蛋白质组学验证目标蛋白下调至关重要,以避免使用无效的sgRNA训练机器学习模型。研究发现,CRISPRi下调失败的情况比预期更常见,通常与dCas9质粒的突变或重组有关,这凸显了使用蛋白质组学验证每个构建菌株的重要性。
主动学习识别了能显著提高异戊二烯醇产量的sgRNA组合
在建立了67个经过验证的sgRNA库后,研究使用主动学习过程来选择最终能将异戊二烯醇滴度提高5倍的组合。从DBTL1(生成伪随机组合数据)开始,到DBTL2-6周期,使用自动化推荐工具(ART)来探索预测能提高产量的、包含多达四个sgRNA的CRISPRi阵列。ART利用机器学习模型集成和贝叶斯推断,有效利用小数据集并量化不确定性。研究人员将基因靶点身份表示为长度为67的二进制向量(输入),并使用ART预测异戊二烯醇滴度(响应)。在六个DBTL周期中,共测量了347个sgRNA组合的异戊二烯醇产量和全局蛋白质组学数据,产生了12个独特菌株,其产量比对照提高了至少4倍。随着每个周期新数据的加入,模型的预测能力(交叉验证R2)从DBTL1后的0.04提高到DBTL6后的0.65。尽管初始预测精度较低,但ART仍能产生有效的推荐,引导搜索穿过相空间以提高滴度。对最终16个关键sgRNA的“父子”分析表明,多数有益sgRNA的添加对滴度有积极影响,且其效果对其他sgRNA的存在与否具有稳健性。
通过全局蛋白质组学从CRISPRi中获得生物学见解
在滴度显著提高后,研究人员探索了这些sgRNA如何增强异戊二烯醇生产。大多数与产量提高相关的sgRNA扰动了氧化磷酸化和三羧酸循环(TCA cycle),可能影响ATP的生成。下调电子传递链(ETC)复合物(如细胞色素bo3氧化酶PP_0812-15)导致互补末端氧化酶(如CioA和cbb3-1细胞色素c氧化酶)的上调,这可能增强了ATP的生成。许多高效sgRNA广泛下调了TCA循环中由2-酮戊二酸到琥珀酸的转化过程(如下调sdhB-C, PP_4191-92; mqo1, PP_0751),这与之前观察到的提高异戊二烯醇表型一致。蛋白质组学分析揭示了特定基因下调引发的级联调控变化,这些变化可能共同创造了有利于异戊二烯醇合成的代谢状态。
通过基因敲除研究候选sgRNA的脱靶效应
为了研究高效sgRNA是否存在脱靶效应,研究人员构建了基因敲除(KO)菌株,并比较其在携带靶向sgRNA与非靶向sgRNA时的异戊二烯醇产量。结果显示,对于PP_0815 sgRNA,在ΔPP_0815 KO背景中,携带PP_0815靶向sgRNA的菌株比携带非靶向sgRNA的菌株产量显著更高,表明存在强烈的脱靶效应,即该sgRNA通过下调另一个(或多个)未知基因来驱动产量提升。蛋白质组学分析证实,ΔPP_0815菌株中PP_0815 sgRNA引起了全局蛋白质表达的广泛重排,包括氨基酸生物合成上调和核糖体生物发生下调等。尽管尝试通过过表达候选基因或下调潜在脱靶候选基因来复现PP_0815 sgRNA的表现,但未能成功确定具体的责任基因。研究还发现,仅通过基因敲除很难完全复现CRISPRi下调带来的高产表型,例如PP_0528(ispA,法尼基二磷酸合酶)是必需基因,无法敲除;而敲除PP_4191(sdhB)则导致菌株生长严重受损。将特定KO与PP_0528和PP_0815的sgRNA相结合,能将产量提高至对照的4倍(651 mg/L),略高于无KO背景的2-sgRNA阵列(580 mg/L),表明对某些基因(如涉及脱靶或必需基因)进行调控(而非完全删除)对于实现最佳生产表型至关重要。
综上所述,该研究成功地展示了将主动学习、CRISPRi和实验室自动化协同整合,能够极大加速合成生物学中的DBTL循环。该方法无需特定的先验生物学知识,即可系统性地探索巨大的遗传扰动空间,并快速识别出高产菌株。研究强调了使用蛋白质组学严格验证CRISPRi效果对于为机器学习提供高质量数据的重要性,同时也揭示了CRISPRi在实际应用中的复杂性,包括下调失败、脱靶效应以及与基因敲除表型的差异。这些发现表明,CRISPRi更适合用于快速筛选出对产量有显著影响的关键基因靶点,为后续通过精确的基因组修饰(如启动子或核糖体结合位点工程)构建稳定的生产菌株提供指导。该研究建立的自动化机器学习驱动平台具有高度的通用性,可应用于其他宿主、产品、途径或培养条件,为加速生物制造以应对全球性挑战提供了强大的新范式。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号