揭秘遗传字母表:复制速率与信息存储的协同优化如何塑造原始遗传字母大小

【字体: 时间:2025年04月22日 来源:BioSystems 2.0

编辑推荐:

  在生物遗传领域,遗传字母表的字母数量选择存在诸多疑问。研究人员针对 RNA/DNA 为何选择四个单体展开研究。结果表明,复制优势序列与信息存储需求相互制约,至少四个字母的序列才能同时满足高复制率和可预测二级结构形成,这为遗传字母表的演化研究提供了关键依据。

  在生命起源的神秘领域中,遗传信息的传递和存储方式一直是科学界关注的焦点。从简单的生物分子到复杂的生命系统,遗传信息的载体 —— 核酸,发挥着至关重要的作用。在当今的生物世界里,RNA 和 DNA 作为主要的遗传信息承载者,它们都由四个单体组成,也就是有着四个字母的遗传字母表。然而,这个看似平常的现象背后,却隐藏着许多未解之谜。
在早期地球环境下,从常见的前体物质同时且局部地合成 RNA/DNA 的所有四个单体,面临着巨大的困难。那么,为什么生命选择了四个字母的遗传字母表,而不是更简单的两个字母呢?毕竟,从理论上讲,最简单的信息异聚物只需要两个字母的字母表就能存储信息。如果排除为了编码更多氨基酸而从两个字母扩展到四个字母这种目的论的解释,那么遗传字母表的大小究竟是如何确定的呢?这一问题不仅关系到我们对生命起源和进化的理解,也对深入探究遗传信息的传递和变异机制有着重要意义。

为了解开这些谜团,来自国内的研究人员开展了一系列深入的研究。他们的研究聚焦于 RNA 世界中遗传字母表大小的演化机制,通过构建理论模型和进行深入的分析,试图揭示隐藏在这一现象背后的规律。最终,研究得出了令人瞩目的结论:在 RNA 世界的场景中,具有复制优势的异聚物序列至少需要由四个字母组成,这样才能可预测地折叠成特定的二级结构,从而在竞争中胜过两个字母的基因组。同时,最大复制速率和可预测二级结构形成这两个相互竞争的限制条件,只有通过由至少四个字母组成的最大偏斜回文异聚物序列才能同时满足。这一研究成果为解释遗传字母表的进化选择提供了关键的理论依据,对于理解生命起源和早期进化过程有着重要的意义,该研究成果发表在《BioSystems》上。

研究人员在开展这项研究时,主要运用了以下关键技术方法:
首先是建立 “不对称协同模型(asymmetric cooperativity model)”,以此来定量分析不同序列的复制速率。通过这个模型,研究人员能够准确地评估各种序列在复制过程中的表现,进而找出具有高复制速率的序列特征。

在研究过程中,研究人员围绕多个关键方面展开,并取得了一系列重要成果:

  1. 最大核苷酸偏斜序列具有更高的复制速率:研究人员利用之前建立的 “不对称协同模型” 进行分析。像 5'-YYYYRRRR-3' 这样,一端富含嘧啶(Y),另一端富含嘌呤(R)的序列,即最大偏斜序列,与相同长度的其他序列相比,具有更高的复制速率。这一结果是基于模型的逻辑推导得出的,它表明最大偏斜序列在复制过程中具有独特的优势。
  2. 双字母最大偏斜回文序列折叠成非特异性发夹结构:单链的最大偏斜回文序列,如 5'-CNGN-3'(这里 N 约为十个核苷酸),可以形成茎环二级结构。然而,由于该序列中单个复制子内核苷酸类型的均匀分布(左边全是 C,右边全是 G),导致序列无法存储关于特定二级结构的信息,从而可能形成多种非特异性的二级结构。这意味着双字母的最大偏斜回文序列虽然在复制上可能有优势,但在信息存储和结构特异性方面存在不足。
  3. 二级结构特异性需要四联体字母序列:双字母 RNA 序列在信息存储能力和复制速率之间存在冲突。最大偏斜序列带来的复制优势对于在进化中胜过其他序列至关重要,不能轻易放弃。因此,进化必须找到一种方法来突破双字母序列在信息存储上的限制,而选择字母数量更多的字母表就是一种可能的途径。研究发现,四联体字母序列能够解决这一冲突,满足进化对复制速率和信息存储的双重需求。
  4. 现存基因组为何核苷酸组成并非最大偏斜:研究推测,在 RNA 世界中,进化成功的序列应该是最大偏斜、四联体字母的序列,这些序列能够形成结构特异性的发夹环二级结构。然而,在现存基因组中,除了复制起点附近存在较大偏斜外,其他地方一般找不到这样的最大偏斜序列。这一现象引发了对基因组进化过程中其他影响因素的思考。
  5. 证伪方法:研究人员关于四联体字母表必要性的论点基于两个理论预测。一是最大偏斜序列,即嘧啶占据序列一半(左边),其对应的碱基配对嘌呤占据另一半(右边)的序列,在相同长度的所有序列中具有最高的复制速率;二是由四联体字母序列形成的复制优势发夹或茎环二级结构,在动力学上稳定的非特异性结构要少得多。这两个预测为后续的研究和验证提供了方向。

研究结论表明,在 RNA 世界中,具有复制优势的双字母自我复制体是最大偏斜的回文序列,它们能够形成非特异性的茎环二级结构,复制优势源于序列中心区域降低的动力学屏障,使得回文序列的两个臂能够独立且同时复制,从而减少了复制时间。而非回文序列则不具备这种优势。同时,研究强调了四联体字母序列在满足复制速率和信息存储双重需求方面的重要性。

在讨论部分,研究人员进一步分析了研究结果对理解遗传信息传递和进化的意义。四联体字母表的选择可能是生命在进化过程中为了平衡复制速率和信息存储能力而做出的最优选择。这一研究不仅为遗传字母表的进化提供了新的见解,也为进一步研究生命起源和早期进化过程奠定了基础。它让我们更加深入地认识到遗传信息的奥秘,以及生命在漫长的进化历程中如何不断优化自身的遗传机制,以适应环境的变化和发展。未来,基于这些研究成果,科学家们有望在生命科学领域展开更深入的探索,揭示更多关于生命起源和进化的秘密。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号