人工智能引导的基因融合延长了合成基因电路的进化半衰期

《SCIENCE ADVANCES》:AI-directed gene fusing prolongs the evolutionary half-life of synthetic gene circuits

【字体: 时间:2025年10月03日 来源:SCIENCE ADVANCES 12.5

编辑推荐:

  STABLES是一种通过融合目标基因(GOI)与宿主内源基因(EG)并优化设计来增强合成生物学工程菌株进化稳定性的方法。采用机器学习模型预测最佳EG-GOI对,选择减少蛋白质折叠干扰的连接子,并优化DNA序列以提高表达和稳定性。实验验证显示,在酵母中,GFP和人类胰岛素的融合表达稳定性显著优于对照组,且泄漏停止密码子策略有效平衡了GOI和EG的表达。该方法为合成生物学提供了通用、可扩展的解决方案。

  在现代生物技术领域,合成生物学正日益成为推动工业应用、生物制造以及生物传感等领域的关键技术。然而,一个长期存在的挑战是工程基因在进化过程中可能发生的不稳定性,这常常导致目标基因(GOI)表达的丢失,进而影响合成系统的功能性和可持续性。为了解决这一问题,研究人员提出了一种名为STABLES的基因融合策略,旨在通过与内源性基因(EG)的融合,提高目标基因的稳定性与表达效率。该策略的核心在于使用一种“漏读”终止密码子(stop codon)来实现两种蛋白的共表达,从而在维持细胞生存能力的同时,保障目标蛋白的高产量。通过引入机器学习模型,研究人员能够基于生物信息学和生物物理特征预测最佳的GOI-EG配对,并选择最小化蛋白质错误折叠的连接子(linker),同时优化DNA序列以增强稳定性与表达水平。实验结果表明,STABLES在酵母(Saccharomyces cerevisiae)中显著提高了荧光蛋白和人胰岛素原的稳定性与产量,为合成生物学的广泛应用提供了新的方法论。

### 一、合成生物学中的进化稳定性挑战

合成生物学通过设计和构建新的生物系统,实现了对多种功能的工程化改造,包括生产治疗性蛋白、生物传感和生物制造等。然而,随着这些系统在工业和环境中的应用,如何维持其在进化过程中保持稳定成为一个关键问题。在合成基因的表达过程中,往往会对宿主细胞的代谢产生负担,这种负担可能为那些能够降低或消除表达的突变提供选择优势。因此,这些突变可能在宿主细胞中扩散,导致目标蛋白表达的丢失,从而影响整个工程系统的功能和适用性。此外,这种不稳定性还可能带来监管上的担忧,限制了合成生物学在实验室外的应用。

为了应对这一挑战,研究人员尝试了多种策略,包括构建互补元件库、限制使用特定的基因元件、管理重复序列等问题,以及通过调控种群动态来减少突变的影响。然而,这些方法在技术复杂性和适用性方面存在局限,无法系统性地解决所有类型的突变问题,或者仅适用于特定的基因、宿主或应用场景。其中,一种较为常见的策略是将目标基因与一个必需基因(EG)的表达耦合,使突变对目标基因的表达影响也影响到必需基因的表达,从而对宿主产生负面影响。然而,这种方法需要高度特定的基因重叠设计,限制了其适用范围。此外,一些方法依赖于复杂的生物传感器系统,要求较高的实验设计和操作难度。而另一种策略则是使用相同的启动子对两个基因进行表达,但这也无法有效防止启动子突变带来的影响。

### 二、STABLES的创新策略与设计原理

STABLES提供了一种更加系统和通用的解决方案,其核心在于通过基因融合的方式,将目标基因与一个内源性基因结合,利用共享的启动子在单一开放阅读框(ORF)中进行表达,并在GOI之后插入一个“漏读”终止密码子,以实现GOI和融合蛋白的差异化表达。这一策略不仅能够通过共享启动子的方式提高GOI的表达稳定性,还能够通过“漏读”终止密码子的设置,确保宿主细胞在缺乏GOI表达时仍然能够维持基本的生存能力。因此,任何可能降低GOI表达的突变都会对宿主细胞的生存产生负面影响,从而被自然选择所淘汰。

在STABLES的设计中,基因融合的实现需要以下几个关键步骤:首先,选择一个内源性基因作为融合伙伴,该基因的表达水平和突变稳定性由机器学习模型进行预测;其次,选择一个连接子(linker),以最小化蛋白质错误折叠的风险;第三,对融合基因进行序列优化,以避免高突变率区域并提高表达效率;最后,通过“漏读”终止密码子的设置,确保GOI的表达与融合蛋白的表达之间保持适当的平衡。这种策略的实施,使得宿主细胞在突变影响GOI表达时,无法维持其自身的生存,从而抑制了突变的传播。

### 三、实验验证与性能评估

为了验证STABLES的有效性,研究人员在酵母中进行了实验,通过将绿色荧光蛋白(GFP)与不同内源性基因融合,观察其在15天内的表达稳定性。实验结果显示,与未融合的GFP相比,融合基因的表达更为稳定,表明该策略在提高基因表达稳定性方面具有显著效果。此外,研究人员还评估了不同内源性基因对GFP表达稳定性的影响,发现某些基因在稳定性方面表现优于其他基因,进一步强调了理性选择内源性基因的重要性。

在更广泛的应用中,研究人员将STABLES应用于人胰岛素原的表达稳定性研究。通过机器学习模型预测最佳的内源性基因伙伴,他们选择了两个基因——CAF20和ARC15。实验结果显示,与原始的人胰岛素原表达系统相比,融合后的基因在30天的实验室进化实验中表现出更高的表达稳定性,且在30天后仍然保持较高的表达水平。此外,通过纳米孔测序,研究人员发现融合基因在实验过程中受到的突变较少,而未融合的基因则几乎完全丢失,进一步验证了STABLES在提高基因稳定性方面的有效性。

### 四、机器学习在基因融合设计中的作用

为了系统性地选择最佳的GOI-EG配对,研究人员开发了一个基于机器学习的模型,该模型能够基于生物信息学和生物物理特征进行预测。模型的训练数据来源于酵母中大量GOI-EG融合基因的荧光数据,通过分析这些数据,研究人员能够识别出哪些基因对的融合效果最佳。在模型的训练过程中,研究人员考虑了多种生物信息学特征,包括密码子使用偏好(如tAI和CAI)、GC含量、mRNA折叠能量、ChimeraARS评分等,这些特征在基因表达和稳定性方面具有重要意义。

模型的性能评估显示,其在预测基因融合效果方面表现出较高的准确性和稳定性。通过使用K近邻(KNN)和XGBoost(XGB)的集成模型,研究人员能够更全面地评估不同基因对的融合效果。此外,模型还能够根据不同的实验条件和基因特性进行调整,以适应不同的应用场景。例如,在某些情况下,研究人员可能需要对内源性基因进行进一步的优化,以确保其在宿主细胞中的表达稳定性。通过这种系统性的方法,研究人员能够显著提高基因融合设计的效率,减少实验验证的次数,并提高最终结果的可靠性。

### 五、基因融合策略的可扩展性与适应性

STABLES不仅在酵母中表现出良好的效果,其设计原则还具有广泛的适用性。这一策略的核心在于将目标基因与内源性基因融合,通过共享启动子和“漏读”终止密码子的方式,确保宿主细胞在突变影响目标基因表达时仍然能够维持基本的生存能力。因此,该策略可以适用于多种宿主细胞类型,而不仅仅是酵母。此外,连接子的选择和序列优化也具有一定的通用性,能够根据不同的基因特性和宿主环境进行调整,以确保融合基因的稳定性和表达效率。

此外,STABLES的策略还具有较强的适应性,能够应对不同的生物应用场景。例如,在工业生物制造中,保持目标基因的长期稳定表达可以显著提高生产效率,降低维护成本,并简化监管流程。而在环境应用中,基因融合策略可以支持长期的基因表达,使得合成生物系统能够在复杂的、不可控的环境中持续发挥作用。因此,STABLES不仅是一种有效的解决方案,还具有广阔的前景,能够推动合成生物学在多个领域的应用。

### 六、未来发展方向与研究建议

尽管STABLES在实验中表现出良好的效果,但其进一步的发展仍然需要更多的研究和优化。首先,研究人员可以扩展模型的训练数据,以涵盖更多类型的宿主细胞和目标基因,从而提高模型的通用性和适应性。其次,连接子的选择和优化仍然需要更多的实验验证,以确保其在不同基因融合中的有效性。此外,研究人员还可以探索更多关于基因表达和突变稳定性之间的关系,以进一步优化基因融合设计。

在实验方面,研究人员可以继续使用不同的宿主细胞进行验证,以测试STABLES在不同环境下的适用性。同时,也可以尝试将该策略应用于更复杂的生物系统,例如多基因融合或更广泛的基因工程应用。此外,研究人员还可以结合更多的生物信息学工具,如AlphaFold等,以提高蛋白质结构预测的准确性,从而更好地指导连接子的选择和优化。

总之,STABLES为解决合成生物学中的进化稳定性问题提供了一种新的思路和方法。通过将目标基因与内源性基因融合,并结合机器学习和生物物理模型,研究人员能够系统性地提高基因表达的稳定性,减少突变的影响,并提高生物系统的长期适用性。这一策略不仅在实验中表现出良好的效果,还具有广泛的可扩展性和适应性,为未来的生物技术应用提供了坚实的基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号