successor sequence predictor:开启蛋白质进化预测与工程的新征程

《Journal of Cheminformatics》:Anticipating protein evolution with successor sequence predictor

【字体: 时间:2025年03月22日 来源:Journal of Cheminformatics 7.1

编辑推荐:

  研究人员开发 SSP 预测蛋白质进化,在多种蛋白属性研究中成果显著,为蛋白质工程提供新工具。

  

蛋白质进化预测:从困境到突破

在生命科学的广袤领域中,蛋白质进化一直是备受瞩目的研究焦点。蛋白质,作为生命活动的主要承担者,其进化过程蕴含着无数奥秘。然而,当前预测和理解蛋白质进化面临着诸多挑战。传统的理论模型大多是描述性的,无法精准预测蛋白质未来的氨基酸突变以及这些突变在种群中的固定概率。而在实验方面,像定向进化这类用于探究蛋白质进化序列空间的技术,不仅需要专业技能,还耗费大量的时间和资源。这些困境如同重重枷锁,限制了蛋白质进化研究的步伐,也使得开发更高效、精准的预测方法成为迫切需求。
为了打破这一僵局,来自 Masaryk University 等机构的研究人员展开了深入探索,他们提出了一种名为后继序列预测器(Successor Sequence Predictor,SSP)的创新方法。这一研究成果发表在《Journal of Cheminformatics》上,为蛋白质进化研究带来了新的曙光。

研究方法:融合创新,精准预测

研究人员在开发 SSP 的过程中,运用了多种关键技术。首先是祖先序列重建(ancestral sequence reconstruction,ASR),通过构建系统发育树和序列比对,追溯蛋白质的进化历史,确定进化过程中受到选择压力的位点。同时,精心挑选了 9 个 AA 指数(AAindices),这些指数涵盖了分子重量、熔点、残基体积等多种物理化学描述符,用于反映氨基酸的特性。
SSP 的工作流程较为复杂。研究人员先利用目标蛋白的 FASTA 序列,通过 BLAST 搜索同源序列,并进行筛选和聚类。之后,构建多个系统发育树,对每个树中的节点进行祖先序列重建。在此基础上,通过计算氨基酸物理化学特征的变化,利用线性回归模型预测蛋白质序列中每个位置的下一个氨基酸,从而模拟实验室的蛋白质进化过程。

研究结果:多维度验证,成果卓越

  1. 数据集统计:研究人员使用 SSP 对多种蛋白质的同源集进行测试,包括左旋葡聚糖激酶(levoglucosan kinase)、冷休克蛋白 CspB(cold shock protein CspB)、ADP - 核糖基精氨酸水解酶(ADP - ribosylarginine hydrolase)和氨基糖苷 3- 磷酸转移酶(aminoglycoside 3-phosphotransferase)。由于部分数据集无法涵盖 SSP 预测的所有突变,研究结果仅基于有实验数据验证的突变点。
  2. 工程热稳定性:对于冷休克蛋白 CspB,SSP 预测的 14 个突变中,6 个具有稳定蛋白质的作用(ΔΔG 低于 - 1 kcal/mol),8 个为中性突变(ΔΔG 在 - 1 kcal/mol 至 1 kcal/mol 之间)。而且,7 个突变提高了蛋白质的熔点(Tm),只有 3 个突变降低了熔点。这表明 SSP 在预测提高蛋白质热稳定性的突变方面具有一定的准确性。
  3. 工程溶解度:在对左旋葡聚糖激酶的研究中,SSP 预测的突变对蛋白质溶解度大多呈现中性或略微增强的效果。如 I3L 和 I3F 突变对溶解度呈中性影响,D9G 和 K38Q 突变则略微提高了溶解度,只有 V200A 突变在大肠杆菌中表现出略微降低溶解度的效果,说明 SSP 预测的突变不会显著损害蛋白质的溶解度。
  4. 工程活性:针对氨基糖苷 3- 磷酸转移酶,该酶与细菌对抗生素的耐药性相关。SSP 生成了 221 个预测,这些预测的突变平均富集值(AAC)为 1.36,远高于随机突变的 0.82,且 MAP 水平预测的 AAC 值(1.4)略高于 SAP 水平(1.34),表明 SSP 在提高酶活性方面的预测能力较强,能有效筛选出更具活性的突变体。
  5. 进化选择:研究人员利用结构整合正选择(Structure Integrated with Positive Selection,SIPS)资源,对 ADP - 核糖基精氨酸水解酶进行研究。该酶有 8 个正选择位点,SSP 成功预测了其中 7 个位点,且 6 个为 MAP 预测,显示出 SSP 对具有进化意义位点的选择性预测能力。

研究结论与意义:开启蛋白质工程新篇章

SSP 作为一种全新的蛋白质设计方法,通过预测氨基酸的进化来推断蛋白质未来的突变,为蛋白质工程提供了有力的工具。与其他方法相比,如 Proseeker,SSP 不局限于特定类型的蛋白质或短肽序列,具有更广泛的适用性。它通过精心挑选 AA 指数,避免了指数冗余和上下文特异性带来的问题。
尽管目前 SSP 还存在一些局限性,如依赖同源集的大小和质量,但这一研究成果无疑为蛋白质进化预测和蛋白质工程开辟了新的道路。它能够帮助研究人员更高效地设计具有特定功能的蛋白质,如提高蛋白质的热稳定性、活性和溶解度等。在未来,随着研究的不断深入和技术的进一步完善,SSP 有望在生物制药、工业酶生产等领域发挥重要作用,推动生命科学和健康医学领域的发展。
综上所述,SSP 的出现是蛋白质进化研究领域的一项重要突破,为后续的研究和应用奠定了坚实的基础,开启了蛋白质工程的新篇章。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
    生物通微信公众号
    微信
    新浪微博

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号