ESM-Ezy:挖掘卓越性能新型多铜氧化酶的深度学习策略 —— 开启高性能生物催化剂发现新征程

《Nature Communications》:

【字体: 时间:2025年04月07日 来源:Nature Communications

编辑推荐:

  为解决从 UniProt 数据库预测酶功能及挖掘高性能酶的难题,研究人员开展了基于深度学习的酶挖掘策略研究。他们开发出 ESM-Ezy,成功鉴定出具有优越催化性能的新型多铜氧化酶(MCOs)等,为发现高性能生物催化剂提供新途径。

  在生物催化领域,酶作为生物催化剂,在食品、农业、化工和制药等众多行业中发挥着至关重要的作用。然而,现有的酶在催化性能上常常难以满足各种工业应用的严苛要求。传统的基于蛋白质序列信息挖掘酶的策略,即便收集了大量来自不同生物的序列数据,在功能注释上仍存在不准确的问题,尤其是对于低序列相似性的酶,其功能预测面临巨大挑战。而且,从海量的蛋白质序列中识别出具有增强催化性能的卓越酶更是困难重重。
为了攻克这些难题,西湖大学的研究人员开展了一项具有创新性的研究。他们开发了一种名为 ESM-Ezy 的深度学习策略,旨在从大量序列数据库中高效发现具有优越催化性能的新型酶。该研究成果发表在《Nature Communications》上。

研究人员采用了多种关键技术方法。首先,利用蛋白质语言模型(PLMs)中的 ESM-1b 模型,通过对其进行微调,学习序列的表示空间。在构建数据集时,精心准备了包含 147 个已表征 MCOs 的高质量正数据集和来自 Swiss-Prot 的 550,000 个非 MCO 序列的负数据集。通过五折交叉验证评估模型的稳健性,还运用了动态负采样策略平衡数据。此外,借助 TM-score 和序列同一性分别量化结构和序列相似性,利用多种实验技术对酶进行表达、纯化、活性测定以及结构解析等 。

研究结果如下:

  • 开发深度学习模型识别低序列相似性 MCOs:ESM-Ezy 采用两阶段策略,先对 ESM-1b 进行微调,通过二元分类区分 MCOs 和其他序列,再利用微调后的模型搜索新型 MCOs。从 UniRef50 数据库中筛选出的 MCOs 与查询酶(QEs)序列相似性大多在 25% - 35%,但结构相似性较高(TM-score >0.8)。系统发育分析和序列相似性网络(SSN)分析表明,欧氏距离短的 MCOs 在进化上不一定密切相关。
  • 所选 MCOs 的表征显示其为优越催化剂:研究人员表达并纯化了所选 MCOs,通过标准 ABTS 氧化反应对其催化性能进行全面评估。结果发现,几乎所有 MCOs 都能有效氧化 ABTS,约 40% 的 MCOs 在催化效率或热稳定性方面优于 QEs。例如,Sulfur 在 80°C 下的半衰期长达 156.9 分钟,比 Eclac 活性高 32.9 倍;Tocean 和 Bfre 的催化效率分别比 HR03 高 5.8 倍和 95.2 倍。此外,部分 MCOs 在较宽的温度、pH 范围以及有机溶剂耐受性方面表现出色,如 Sulfur 在 30 - 50°C 仍保持较高活性,在 pH 为 5.0 - 8.0 时也能维持活性,且在多种有机溶剂中孵育 2 天后,仍保留至少约 80% 的初始活性。
  • 表现最佳的 MCOs 的结构表征揭示独特特征:解析了 Bfre 和 Sulfur 的晶体结构,Bfre 的活性中心包含一个独特的由 Cu 离子和 Mn 离子组成的双原子中心,区别于传统 MCO 的活性中心。Sulfur 与 Eclac 结构相似(TM-score 为 0.92),但序列相似性仅 28.49%,Sulfur 的一个 loop 区域比 Eclac 短,分子动力学模拟显示该区域更稳定,且 Sulfur 的盐桥数量比 Eclac 多 1.6 倍,这增强了其热稳定性。
  • 新挖掘的 MCOs 在生物修复中的应用:评估了新挖掘的 MCOs 在生物修复中的性能,包括有机染料脱色、抗生素和毒素降解。在有机染料脱色实验中,所有 MCOs 在 10 分钟内就能快速催化 Remazol Brilliant Blue R(RBBR)脱色,Sulfur 在 10 分钟内可使 RBBR 脱色 46.7%,是目前报道的无介质 RBBR 脱色效率最高的 MCO。在抗生素降解实验中,所有测试的 MCOs 在室温下都能降解氯霉素(CAP),Talbi 在 48 小时内降解 CAP 的比例高达约 24.3%,优于之前的真菌系统。在毒素降解实验中,多个 MCOs 能有效降解黄曲霉毒素 B1(AFB1),Bcece 在 48 小时内可降解 39.4% 的 AFB1,且经 Bcece 处理后,HepG2 细胞的活力显著提高,表明 AFB1 降解产物的细胞毒性降低。

研究结论和讨论部分指出,ESM-Ezy 成功地利用微调的 ESM-1b 模型和蛋白质语义空间相似性计算,高效发现了具有增强催化性能的新型 MCOs。与 QEs 相比,44% 的所选 MCOs 在至少一种性能上表现更优,在生物修复应用中也展现出良好的效果。此外,将 ESM-Ezy 应用于 L - 天冬酰胺酶(L-asparaginase)的挖掘,也成功鉴定出比 QEs 具有更高比活性和催化效率的酶。这表明该方法具有广泛的适用性,为发现高性能酶和揭示具有独特结构特征的新酶提供了一种有前景的策略,有望加速创新生物催化剂的发现,推动工业生物技术的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号