《Molecular Catalysis》:Design of L-methionine γ-lyase using protein language models and molecular simulations to enhance catalytic efficiency and antitumor activity
编辑推荐:
本研究利用SaProt蛋白语言模型构建PpMGL的残基水平适配景观,筛选出Y367S/Y189F/N263P/Y45E/T301A五突变体,显著提升催化效率(1.7倍)、热稳定性(1.5℃)和血浆残留活性(4.2倍),分子动力学模拟表明突变增强近攻击构象频率,体外实验验证其抑制五种癌细胞增殖,为代谢靶向抗癌疗法提供新候选。
樊帅|陈浩东|岳永婷|严克清|邹森|金园园|杨照勇
中国医学科学院北京协和医学院药物生物技术研究所抗生素生物技术国家重点实验室,北京100050
摘要
甲硫氨酸γ-裂解酶(MGL)是一种依赖于吡哆醛5′-磷酸(PLP)的酶,可催化l-甲硫氨酸的γ-消除反应,并通过选择性剥夺依赖甲硫氨酸的肿瘤细胞的营养而展现出良好的抗肿瘤潜力。然而,细菌来源的MGL存在催化效率低、体内稳定性差以及免疫原性高的问题,这些因素限制了其临床应用。在本研究中,我们利用蛋白质语言模型SaProt生成了Pseudomonas putida MGL(PpMGL)的残基级适应性景观图谱,对每个氨基酸位点进行了评分,以评估其增强催化活性和稳定性的可能性,从而识别出可能提高酶性能的突变位点。经过活性测定和迭代突变组合实验,五重突变体Y367S/Y189F/N263P/Y45E/T301A的催化效率提高了1.7倍(kcat/KM),熔点上升了1.5°C,血浆中的酶活性提高了4.2倍。分子动力学模拟表明,这些突变显著增强了接近攻击构象的形成频率,改善了底物和PLP辅因子的几何定位,从而提升了催化性能。体外抗肿瘤实验显示,该突变体在包括HepG2和HGC-27在内的五种人类癌细胞系中表现出更低的IC??值和更强的抗增殖作用。综上所述,本研究结合深度学习引导的设计与结构机制解析,成功开发出了一种具有优异活性和稳定性的重组MGL变体,为新型代谢靶向抗肿瘤治疗药物的开发提供了有前景的候选酶。
引言
甲硫氨酸γ-裂解酶(MGL,EC 4.4.1.11)是一种依赖于吡哆醛5′-磷酸(PLP)的酶,可催化l-甲硫氨酸的γ-消除反应,生成甲硫醇、α-酮丁酸和氨[1]。MGL以同源四聚体形式存在,每个亚基结合一个PLP分子,在非哺乳动物生物中广泛分布[2,3],并在P. putida中得到了深入研究[4,5]。由于甲基化水平异常升高,许多癌细胞表现出“甲硫氨酸依赖性”[6],这种代谢依赖性在多种实体瘤(如前列腺[9]、乳腺[10]和结直肠癌[11])中均有报道。这种依赖性已成为癌症治疗中代谢干预的有希望的目标[7]。通过耗尽细胞外的l-甲硫氨酸,MGL能够选择性抑制依赖甲硫氨酸的癌细胞增殖,诱导细胞周期停滞和快速凋亡[1]。研究表明,MGL诱导的甲硫氨酸饥饿作用可使癌细胞停滞在S/G2期[12],并显著增强其对多种化疗药物的敏感性,凸显了其作为靶向抗肿瘤策略的潜力[1]。
然而,将MGL作为治疗蛋白应用于临床面临诸多挑战,包括催化效率低[13]、生物半衰期短[14]、结构不稳定以及免疫原性高[15]。为了解决这些问题,先前的研究主要集中在蛋白质工程上。例如,对Citrobacter freundii来源的MGL进行位点饱和突变后发现,C末端柔性环中的V358Y突变使催化速率提高了1.9倍,并显著增强了对肿瘤细胞的细胞毒性。此外,为了降低免疫原性,人类半胱硫氨酸γ-裂解酶(CGL)被改造为具有类似MGL的活性,从而保留了降解甲硫氨酸的功能同时降低了免疫风险[15]。PEG化也被用于多种蛋白质治疗中,以降低免疫原性并延长药物循环时间,这表明提高MGL的固有催化活性对其成药性至关重要[17][18][19]。传统的定向进化策略往往因序列空间庞大和通量有限而效果不佳[20],导致理想变体的识别既耗时又费力[21]。因此,构建一个紧凑且功能丰富的突变体库至关重要。
最近蛋白质语言模型的进展使得通过强大的非线性特征学习方法高效探索和重建蛋白质序列-功能关系成为可能[22][23][24]。与传统方法相比,这些模型具有更高的预测准确性和泛化能力。基于Transformer的蛋白质语言模型SaProt[25]在预测大分子功能方面表现出色,能够捕捉序列与功能之间的复杂非线性关系。在无监督条件下运行时,它可以高精度地评估突变体的适应性。在本研究中,我们利用SaProt[26]重建了P. putida来源的MGL的适应性景观图谱,以高置信度识别有益突变。通过将这种计算方法与结构生物学和酶学相结合,我们系统评估了选定突变体的催化和稳定性特征。这项工作为开发新型代谢靶向抗癌生物治疗药物提供了理论框架和实用策略。
材料与试剂
大肠杆菌 TOP10和E. coli BL21(DE3)分别用于质粒构建和异源蛋白表达(均购自中国Weidibio公司)。表达载体pET-21a(+)来自德国Novagen公司。氨苄西林和IPTG购自中国上海Sangon Biotech公司。Co2?-NTA亲和树脂由日本TaKaRa公司提供,30 kDa MWCO超滤装置由美国Millipore公司提供。所有其他化学品均为分析级质量。
基于蛋白质语言模型的突变位点选择
基于大量蛋白质序列和结构数据集训练的SaProt模型[25]能够捕捉序列变异与适应性之间的复杂关系。在本研究中,我们通过输入PpMGL的氨基酸序列,使用SaProt进行零样本预测。该模型分析了单点突变前后序列可能性的变化,从而在无需实验数据的情况下直接评估每个突变的相对功能影响。如图1所示
结论
本研究利用SaProt蛋白质语言模型对PpMGL进行了系统的理性工程改造,并通过实验验证了其效果。构建的五重突变体Y367S/Y189F/N263P/Y45E/T301A在催化效率、热稳定性和血浆稳定性方面均显著优于野生型。分子动力学模拟表明,这些突变增强了NACs的形成频率,从而提高了反应概率
CRediT作者贡献声明
樊帅:撰写初稿、监督、项目管理、方法学设计、实验实施、资金获取、概念构思。陈浩东:数据可视化、项目管理、方法学设计、实验实施、数据分析。岳永婷:结果验证、方法学设计、数据分析。严克清:资源调配、方法学设计、实验实施。邹森:项目监督、实验实施。金园园:项目监督、资金获取。杨照勇:撰写、审稿与编辑、项目管理
利益冲突声明
作者声明不存在可能影响本文研究的已知财务利益或个人关系。
致谢
本工作得到了北京市自然科学基金(编号7244468)、国家自然科学基金(编号82373767)以及CAMS医学科学创新基金(编号2021-I2M-1-070)的支持。