Ceratophyllum demersum L.线粒体基因组的组装与比较分析

《Frontiers in Plant Science》:Assembly and comparative analysis of the mitochondrial genome of Ceratophyllum demersum L.

【字体: 时间:2025年10月27日 来源:Frontiers in Plant Science 4.8

编辑推荐:

  线粒体基因组研究揭示水生植物C. demersum具有三个环状染色体,总长59.5kb,含40个PCGs、3个rRNA和22个tRNA。其非串联重复序列占比达30.6%,显著高于陆生被子植物。系统发育分析支持Ceratophyllales与Chloranthales单系群,并作为单子叶-双子叶的姐妹群,挑战传统分类框架。

  在植物细胞中,线粒体一直被视为能量供应的核心机构,其基因组不仅具有独特的结构特征,还在进化研究中占据着重要地位。线粒体基因组因其复杂的演化轨迹和高度的结构多样性,成为探索植物早期演化历史的关键工具。本研究聚焦于一种广泛分布的水生植物——Ceratophyllum demersum(水草),通过使用PacBio HiFi测序技术,成功组装出其线粒体基因组,并发现其基因组由三个完整的环状染色体组成,长度分别为285,151 bp、208,195 bp和101,944 bp,总长度为595,290 bp,GC含量为49.64%。这三部分染色体中包含65个独特的基因,其中包括40个蛋白质编码基因(PCGs)、3个核糖体RNA基因(rRNA)和22个转运RNA基因(tRNA)。研究还发现,C. demersum的线粒体基因组中非串联重复序列的含量显著高于陆生被子植物,这表明其基因组的结构变化可能与其水生环境密切相关。

水生植物的线粒体基因组在结构和功能上呈现出与陆生植物不同的特点。首先,它们的基因组通常比陆生植物更大,这与线粒体基因组中频繁的重组事件密切相关。线粒体基因组的重组不仅有助于维持DNA的稳定性,还能促进其进化,导致基因组大小和结构的巨大差异。例如,某些水生植物的线粒体基因组可达18.99 Mb,远高于陆生植物的平均水平。此外,线粒体基因组的结构多样性也极为显著,包括多环、单环、线性、分支线性、分支环状等多种形式,这种多样性在细胞内呈现出不同的分布频率。因此,线粒体基因组的结构复杂性给其完整组装带来了挑战,特别是在缺乏有效提取方法和序列保守性较低的情况下,传统的测序和拼接技术往往难以准确解析其结构。

随着新一代测序技术的发展,特别是第三代长读长测序技术的广泛应用,如PacBio HiFi和Oxford Nanopore Technologies(ONT)R10平台,研究人员现在能够更高效地组装植物线粒体基因组。这些技术的优势在于其能够提供高精度的长读长数据,从而克服了传统方法在处理复杂结构和重复序列时的局限性。此外,专门针对植物线粒体基因组开发的拼接工具,如PMAT、TIPPo、OATK和HiMT,也显著提升了线粒体基因组的组装效率。其中,PMAT无需预先筛选线粒体读段,而是通过利用叶绿体、线粒体和核基因组的拷贝数差异,在全基因组拼接过程中直接获取完整的线粒体组装结果,这种方法在处理线粒体基因组的复杂性方面具有明显优势。

线粒体基因组在植物系统发育研究中具有重要作用。尽管其进化速率较慢,但这种特性使其在解析远古植物谱系关系方面具有独特优势。例如,线粒体基因组中的保守蛋白编码基因能够提供丰富的系统发育信息,尤其在某些基因组中,这些基因的保留或丢失可能反映了特定的演化路径。在本研究中,C. demersum的线粒体基因组保留了所有24个核心蛋白编码基因,并且仅丢失了三个可变基因:rpl6rps8rps19。这一结果与古代被子植物如木兰科和肉质植物科的线粒体基因组具有相似的基因组成,表明C. demersum在线粒体基因组演化过程中可能占据了一个独特的进化位置。

此外,线粒体基因组中的重复序列对于基因组的重组和演化具有重要影响。在本研究中,C. demersum的线粒体基因组中发现了大量非串联重复序列,共计41,513对,覆盖了约30.62%的整个基因组。这些重复序列不仅在基因组结构上表现出高度的多样性,还可能在基因表达调控、基因组稳定性维持以及环境适应性方面发挥重要作用。例如,非串联重复序列可能通过重组机制影响线粒体基因组的排列方式,而串联重复序列则可能参与基因组的扩增和变异过程。这些重复序列的存在,使得线粒体基因组在不同物种间呈现出显著的结构差异,进一步推动了其在演化过程中的动态变化。

线粒体基因组的结构多样性还体现在其基因排列方式上。在本研究中,C. demersum的线粒体基因组被组装为三个独立的环状染色体,这种结构在被子植物中较为罕见。相比之下,许多陆生植物的线粒体基因组通常由单一环状结构组成,而水生植物则可能因环境压力和基因组重组的频繁发生,形成更为复杂的结构。此外,线粒体基因组中的基因排列并非完全保守,部分基因在不同物种中表现出不同的分布模式。例如,nad1nad2nad5等基因在多个染色体上分散存在,而其他基因则主要集中在某一染色体上。这种基因分布的差异可能反映了不同植物类群在演化过程中对线粒体基因组结构的适应性调整。

线粒体基因组的RNA编辑事件也是其演化过程中不可忽视的重要特征。RNA编辑是一种在转录后阶段对基因序列进行修饰的机制,能够校正基因组中的“错误”并调控基因功能。在本研究中,C. demersum的线粒体基因组中发现了701个C-to-U类型的RNA编辑位点,其中大多数位于第二密码子位置,这表明RNA编辑在基因表达调控中起着关键作用。此外,某些基因如nad4nad5nad7表现出较高的RNA编辑频率,而其他基因如atp8rpl2rps7则仅表现出极少数的编辑事件。这些RNA编辑事件可能与线粒体基因组的结构变化和功能适应性密切相关,尤其是在涉及氧化磷酸化和线粒体翻译过程的基因中。

系统发育分析的结果进一步揭示了线粒体基因组在解析被子植物演化关系中的价值。通过使用25个保守的线粒体蛋白编码基因,研究人员构建了一个基于最大似然法(ML)的系统发育树,该树支持了被子植物中五个主要类群的单系性,即木兰类、樟目、单子叶植物、双子叶植物和水生植物。其中,C. demersum所在的Ceratophyllales目与Chloranthales目被划分为一个单系分支,并且该分支被识别为单子叶和双子叶植物的姐妹群。这一发现与传统的APG IV分类系统有所不同,表明线粒体基因组可能为被子植物早期演化提供了新的视角和替代假说。此外,系统发育树中大多数节点的自举支持值超过80%,说明该演化关系具有较高的可靠性。

本研究的意义在于,它不仅为理解水生植物线粒体基因组的结构和功能提供了新的数据支持,还为被子植物早期演化研究提供了重要的参考。通过比较不同植物类群的线粒体基因组,研究人员能够更深入地探讨线粒体基因组在演化过程中的动态变化及其对植物适应性的影响。同时,本研究也强调了利用长读长测序技术和专门的线粒体基因组拼接工具在解析复杂基因组结构方面的潜力。未来的研究可以进一步扩大水生植物线粒体基因组的样本量,分析其重复序列的演化规律,并结合功能实验探讨重复序列在维持基因组稳定性中的具体作用。此外,将线粒体基因组与其他细胞器基因组(如叶绿体和核基因组)的数据进行整合,将有助于更全面地理解植物演化过程中的基因组变化,并为解决长期存在的系统发育难题提供新的思路和方法。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号