
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:从机器学习到多模态模型——人工智能在酶工程领域的革命
【字体: 大 中 小 】 时间:2025年08月31日 来源:BioDesign Research 4.7
编辑推荐:
这篇综述系统阐述了人工智能(AI)在酶工程中的应用演进,涵盖机器学习(ML)、深度学习(DL)、蛋白质语言模型(pLM)到多模态架构的四大发展阶段,重点解析了酶功能注释、结构建模(如AlphaFold3)、性质预测(如kcat/KM)等核心任务,并展望了动态模拟和智能代理(如BioReason)的未来趋势。
从静态结构到动态设计:AI驱动的酶工程革命
引言:酶的催化核心与工程挑战
作为生命活动的核心催化剂,酶通过降低反应活化能(如KM值优化)驱动生物转化。传统定向进化依赖随机突变筛选,而AI技术正通过数据驱动的“挖掘-设计-验证”三角框架重构这一领域。
功能建模:从EC分类到动力学预测
酶功能预测的核心是EC编号系统(如氧化还原酶EC1)。对比学习模型CLEAN通过序列嵌入聚类实现高精度EC分类,而UniKP联合ProtT5和SMILES Transformer预测kcat等动力学参数,其环境因子增强版EF-UniKP进一步整合pH/温度影响。GO注释任务中,ProtCLIP通过序列-文本对齐提升细胞定位(CC)预测。
结构设计:单体与复合体的AI重构
AlphaFold3和RoseTTAFold All-Atom实现了从单链蛋白到蛋白-配体复合体的原子级预测。逆折叠工具PiFold采用一步生成策略,在CATH4.2数据集上超越传统自回归模型。对于结合位点,MaSIF基于分子表面几何指纹识别辅因子(如FAD/NADP)结合口袋,而Rossmann-toolbox可针对性设计辅因子偏好性突变。
多模态与智能代理的崛起
ESM3统一序列-结构-功能三模态建模,而BioReason融合DNA模型(Evo2)与通用大语言模型(Qwen3),实现KEGG通路级别的机制推理。DrugPilot等代理系统通过参数化提示模板协调分子生成-优化全流程,标志AI从工具向自主科研伙伴的转型。
挑战与未来:动态模拟与能量景观
当前模型仍局限于静态结构预测。新兴工具如Nearl将分子动力学(MD)轨迹编码为3D体素特征,为折叠路径建模奠定基础。未来需开发高时空分辨率实验平台,以训练能模拟全折叠过程的AI系统,最终实现“能量景观定制化”的酶设计。
结语
AI正推动酶工程从经验驱动迈向可解释、通用化的智能时代。建立标准化数据集(如TrpB突变库)、发展动态多模态框架、增强实验验证闭环,将是实现“设计-预测-制造”一体化突破的关键。
生物通微信公众号
知名企业招聘