极端组成偏倚下有孔虫密码子使用模式与氨基酸保守之谜

《mBio》:Lost in translation: conserved amino acid usage despite extreme codon bias in foraminifera

【字体: 时间:2025年03月06日 来源:mBio 5.1

编辑推荐:

  本文通过单细胞转录组和系统发育组学,揭示有孔虫密码子使用模式及氨基酸保守的复杂机制。

  ### 研究背景
在真核生物的奇妙世界里,遗传信息的传递与变异遵循着独特的规则。“通用” 遗传密码由 61 个密码子组成,它们负责编码 20 种氨基酸,这就导致了多数氨基酸可由两个或更多密码子编码的冗余现象。在众多生物中,这些冗余密码子的使用频率并不相同。基因组中核苷酸组成受多种因素影响,像突变动力学、偏向性基因转换以及选择作用等。在蛋白质编码区域,由于氨基酸序列的功能限制,核苷酸替换的偏向性会有所缓和,这一现象在密码子的第一和第二位上体现得尤为明显。
过往研究发现,在许多生物类群中,“GC 压力” 会使组成偏向性的分类群在氨基酸使用上也呈现相应偏向。例如,富含 AT 的恶性疟原虫(Plasmodium falciparum)偏好使用富含 AT 密码子的氨基酸(如 “FYMINK”),而富含 GC 的棘阿米巴(Acanthamoeba)则更多地使用富含 GC 密码子的氨基酸(“GARP”) 。同时,同义密码子使用的不均衡,既可能源于中性过程,如背景替换偏向,也可能是选择作用的结果。选择最优密码子可能是为了提高翻译效率,或是确保翻译准确性,减少错译的发生。

微生物真核生物在基因组进化研究中具有重要意义,但以往对它们的研究多集中在少数模式物种上。有孔虫作为一类古老且多样的单细胞真核生物,有着丰富的物种多样性(约 10,000 种)。它们拥有独特的形态特征,如具有外壳(部分谱系中丢失)和精细的网状伪足 。然而,目前对有孔虫基因组结构的了解还十分有限,已有的基因组组装因高度污染而难以提供有效信息,且可用的转录组数据也较少,还常受到共生体和环境序列的污染。

研究方法


为了深入探究有孔虫的密码子使用模式和基因组进化规律,研究人员进行了一系列严谨的实验和分析。他们收集了 49 个有孔虫的单细胞转录组数据,其中 28 个在实验室中分离获得,另外 21 个来自 GenBank。这些样本涵盖了 28 个不同的有孔虫属,代表了有孔虫不同的进化分支。

在数据处理过程中,研究人员运用了 PhyloToL 这一强大的系统发育组学管道对数据进行精心整理。他们基于多个序列比对和基因树构建的方法,去除了样本中的污染序列,确保数据的准确性和可靠性。通过这种方式,他们从最初的大量数据中筛选出了 1,044 个基因家族,为后续的深入分析奠定了坚实基础。

为了推断有孔虫的系统发育关系,研究人员选取了 171 个在 49 个样本中均存在的基因,并将它们进行串联。随后,利用 IQ - Tree 软件和 ModelFinder 模型选择工具,构建了有孔虫的系统发育树。这棵树反映了有孔虫各物种之间的进化关系,为后续分析组成偏向和密码子 / 氨基酸偏好的分布提供了重要的框架。

在评估密码子使用和组成偏向时,研究人员编写了自定义的 Python 脚本,并参考已发表的协议进行分析。他们计算了有效密码子数(ENc),并将其与 GC 含量在第三位四折叠简并位点(GC4)进行比较。同时,利用 Salmon 软件在默认参数下加上 “--validateMappings” 标志来测量转录本的表达水平,以转录本每百万 reads 数(TPM)来表示。此外,研究人员还创新地提出了一种估计位点特异性二核苷酸使用(SSDU)的新方法,通过调整模型中的零期望来计算预期的密码子使用,从而更全面地探究密码子使用的规律。

研究结果


  1. 转录组数据整理与系统发育分析:研究人员在数据整理过程中发现了有趣的现象。一个形态上被鉴定为 Trochammina 属的细胞,在系统发育树中却位于早期分化的单室目长分支上,其 18S - rDNA 序列与单室目 Vellaria 属最为相似。研究人员推测这可能是因为 Vellaria 属的生物 “寄居” 在 Trochammina 属的空壳内。经过多轮严格的数据筛选和整理,最终保留了 41,291 条序列,代表 1,044 个基因家族。

构建的系统发育树显示,Globothalamea、Tubothalamea 和 Xenophyophorea 这几个类群均为单系群,且嵌套在单室目多系群的 “monothalamid” 谱系中。这一结果与之前的研究基本一致,同时也表明研究人员构建的系统发育树能够较好地反映有孔虫的进化关系。在有孔虫中,单室目展现出了最大的遗传多样性,这也暗示了它们在有孔虫进化历程中的重要地位。
2. 核苷酸水平的模式:研究人员对有孔虫转录本中的组成偏向进行评估时发现,其 GC4 的物种中位数在 2.3% - 76% 之间,变化范围极大。根据 GC4 的含量,研究人员将 28 个属分为四类:11 个属表现出极端的 AT 偏向(GC4 中位数小于 15%),9 个属为 “中间型”(17% - 39% GC4),9 个属为 “非偏向型”(40% - 60% GC4),3 个属为 GC 偏向型(70% - 76% GC4)。令人惊讶的是,AT 偏向型的属分布在多个非单系的谱系中,这表明有孔虫的组成偏向在进化过程中可能经历了复杂的变化。

进一步分析发现,有效密码子数(ENc)与 GC3S(除编码色氨酸和甲硫氨酸的密码子外,所有密码子第三位的 GC 含量)密切相关,偏向性越强的分类群使用的密码子越少。而且,所有有孔虫的 ENc 值分布均低于零期望,这意味着可能存在选择作用或其他复杂的动力学机制影响着密码子的使用。在分析密码子使用频率时,研究人员发现极端偏向的有孔虫中,许多密码子的使用频率近乎为零,这一现象难以仅用中性过程来解释。
3. 组成偏向的驱动因素:为了探究是什么因素驱动了有孔虫的组成偏向,研究人员比较了编码区和非编码区(UTRs)的核苷酸组成。他们发现有孔虫 UTRs 的平均 GC 含量在 25% - 45% 之间,范围明显小于编码区沉默位点的 GC 含量(4% - 68%)。虽然 UTR 的 GC 含量与沉默位点的 GC4 存在正相关,但这表明突变过程只能部分解释有孔虫的极端组成偏向,必然还有其他因素在起作用。

研究人员通过中性绘图评估了替换偏向和蛋白质功能限制之间的动态关系。令人意外的是,有孔虫的中性绘图斜率大多接近零或显著为负,这在真核生物中是非常罕见的现象。而且,这种负相关在高表达基因中更为明显,这表明选择作用在塑造有孔虫的基因组组成中起着重要作用,但具体机制仍有待进一步探索。
4. 最优密码子和氨基酸使用的选择:在研究最优密码子的选择时,研究人员发现,在中间型和非偏向型有孔虫中,转录本的表达与 GC4 呈显著正相关;而在 AT 偏向型有孔虫中,这一趋势则相反,表明这些谱系中存在对富含 AT 密码子的正选择。通过计算密码子使用频率与 TPM 的相关性,研究人员发现有孔虫中普遍存在显著的关系,且 AT 偏向型和 GC 偏向型有孔虫的趋势相反。

对于氨基酸使用,通常情况下,氨基酸使用会受到 “GC 压力” 的影响,与潜在的核苷酸组成相对应。然而,在有孔虫中,尽管核苷酸组成差异很大,但氨基酸使用却高度保守。在低表达基因中,GC 压力对氨基酸使用有一定影响;但在高表达基因中,氨基酸使用与沉默位点 GC 含量的相关性几乎为零,这意味着功能限制消除了 GC 压力的影响,使得有孔虫在不同的核苷酸组成下仍能保持相似的氨基酸频率分布。研究还发现,有孔虫的蛋白质中富含亮氨酸、赖氨酸和异亮氨酸,而甲硫氨酸、组氨酸、半胱氨酸和色氨酸含量较低,这一模式在其他生物中也有发现,暗示了可能存在共同的进化选择机制。

研究结论


有孔虫在密码子使用和氨基酸组成方面呈现出独特而复杂的模式。尽管它们的核苷酸组成存在极端的偏向性,甚至在不同谱系间差异巨大,但氨基酸使用却在漫长的约 600 million 年进化历程中保持高度保守 。这种现象表明,有孔虫基因组进化的驱动力十分复杂,涉及替换偏向、上下文依赖的突变、最优密码子选择以及氨基酸选择等多种因素。

目前,有孔虫这种独特模式的形成机制仍未完全明确。研究人员推测,这可能与有孔虫的祖先状态有关,极端 AT 偏向和当前的氨基酸使用模式可能代表了祖先特征,而更 GC 中性的谱系则可能是突变过程改变的结果。另外,有孔虫的基因组可能经历了独立的进化过程,导致极端 AT 偏向的出现,这或许与基因组规模的变异选择或其生命周期中的周期性多倍体化模式有关。

这项研究为我们理解真核生物基因组进化提供了新的视角。有孔虫作为研究对象,为探索遗传信息传递和变异的基本规律提供了独特的模型。未来,对有孔虫及更多真核生物的深入研究,有望揭示更多关于密码子使用、氨基酸组成和基因组进化的奥秘,帮助我们更好地理解生命遗传信息的复杂调控机制。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
    生物通微信公众号
    微信
    新浪微博

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号