通过祖先重建识别共进化位点:一种高效且精准的蛋白质研究新方法

【字体: 时间:2025年03月01日 来源:Communications Biology 5.2

编辑推荐:

  为解决蛋白质共进化位点识别争议问题,研究人员开展相关研究,得出新方法,对蛋白质研究意义重大。

  

探索蛋白质共进化的奥秘:新方法照亮前行之路

在微观的蛋白质世界里,氨基酸之间的相互作用如同一场精妙的 “舞蹈”,其中共进化现象备受关注。蛋白质共进化指的是,当蛋白质中一个位置的变化影响到另一个位置的选择压力,从而维持蛋白质结构或功能时,这两个位置就发生了共进化。想象一下,蛋白质就像一座精密的机器,每个氨基酸都是其中的一个零件,它们相互协作,共同维持机器的正常运转。共进化的氨基酸位点对于蛋白质正确折叠(形成特定的三维结构)和发挥功能至关重要,就如同机器中相互配合的零件,一旦出现问题,整个机器的运作就会受到影响。
然而,目前识别蛋白质中共进化位点的方法却充满争议。大多数方法在分析时忽视了系统发育信息(即蛋白质在进化过程中的亲缘关系信息),就好比在研究机器零件的相互作用时,忽略了这些零件的生产工艺和历史演变,这使得它们难以准确区分真正由共进化导致的变化和由于进化树(反映物种或分子进化关系的树形图)引起的虚假变化。打个比方,就好像在嘈杂的环境中,很难听清真正有用的信息一样。在这样的背景下,研究人员急需找到一种更准确、更有效的方法来识别蛋白质共进化位点,这不仅有助于深入理解蛋白质的工作原理,还能在蛋白质工程、遗传诊断等众多领域发挥重要作用。
为了解开蛋白质共进化位点识别的难题,英国曼彻斯特大学(The University of Manchester)的 Michael G. Nelson 和 David Talavera 开展了一项重要研究,相关成果发表在《Communications Biology》杂志上。
在研究方法上,研究人员另辟蹊径,采用了基于系统发育的方法。首先,他们运用最大简约法(一种在进化树构建中常用的方法,通过最小化进化过程中的变化次数来推断祖先状态)进行祖先重建。这一过程就像是通过现有的物种特征,回溯到它们的祖先,推测出祖先的特征状态,从而确定氨基酸替换发生的位置。然后,对于每对位置,研究人员会统计它们在进化过程中分别发生变化(单独变化)和同时发生变化(并发变化)的次数。为了判断哪些位置对可能是共进化的,研究人员使用了 7 种不同的统计框架进行建模分析,最终发现 Box-Cox 变换模型表现最佳,能以近乎完美的精度和特异性检测共进化对。此外,研究人员还通过模拟合成二进制数据集、模拟多序列比对(MSA)以及对真实生物数据集进行分析等多种方式,全面验证和应用了他们的方法。
下面来看看具体的研究结果:
  1. 共进化位点检测方法的开发:研究人员利用最大简约法进行祖先重建,推断出每个位置在所有祖先节点的状态以及变化发生的分支。之后,他们对不同进化场景、进化水平、比对深度和长度的数据集进行建模分析。结果表明,对 Box-Cox 变换后的因变量进行线性建模,在检测共进化对时具有极高的精度和特异性,能有效减少误报(假阳性)情况的发生。在模拟数据中,该方法能检测到 31.4% 的共进化对123
  2. 方法的验证:研究人员使用合成的 MSA 对方法进行进一步验证。结果显示,无论是基于分支还是节点的方法,都很少出现误报情况。在不同的序列深度和保守水平下,该方法的平均精度达到 0.883,召回率为 0.346。当序列深度达到 3200 时,召回率可超过 0.5,精度也能超过 0.9。这表明该方法在不同条件下都具有较好的稳定性和可靠性456
  3. 在生物数据集上的应用:研究人员分析了 150 个生物数据样本,这些样本来自之前 PSICOV 研究的数据集。通过与 PSICOV 和 EVcouplings 这两种基于序列但不依赖系统发育的算法进行比较,研究人员发现:一半预测的共进化对能被这些方法识别出存在强共变信号;另一半可能由于共变信号较弱而未被识别;同时,这些方法选择的许多共变对并没有很强的共进化证据。此外,研究还发现共进化对在蛋白质序列和结构上往往距离较近,相对溶剂可及性较低,突变率较高,并且共进化位点的香农熵(用于衡量序列中氨基酸的多样性)高于大多数独立进化的位点789
研究结论和讨论部分指出,利用最大简约法识别进化树中过多的并发变化是检测共进化位点的有力方法。虽然部分共进化对进化缓慢,难以被该方法检测到,但许多通过该方法识别出的共进化对,用不依赖系统发育的方法几乎无法检测到。此外,共进化不仅发生在成对的氨基酸之间,还可能涉及多个氨基酸残基。该方法比最大似然法计算量小,更适合用于全基因组研究或大规模 MSA 分析。这项研究为蛋白质共进化位点的识别提供了新的思路和方法,推动了蛋白质研究领域的发展,让我们对蛋白质的奥秘有了更深入的认识,有望为未来蛋白质工程和遗传诊断等领域的发展提供重要的理论支持和技术保障。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号