编辑推荐:
为探究植物线粒体基因组(mitogenome)复杂性与变异,研究人员对大豆进行研究,揭示其结构变异与演化模式。
在植物的微观世界里,线粒体和叶绿体就像两座神秘的 “小工厂”,它们拥有各自独特的基因组,即线粒体基因组(mitogenome)和叶绿体基因组(plastome)。这些基因组在植物的生长、发育和进化过程中,发挥着至关重要的作用,比如调控呼吸作用和光合作用,影响作物产量。
然而,植物线粒体基因组的研究却困难重重。它的结构变化多端,大小差异极大,从 66kb 到 12,000kb 不等,基因组成也十分复杂,还存在大量的重复序列和重组事件,使得传统的研究方法难以深入探究其奥秘。而且,以往的研究大多聚焦于单一类型的植物生命周期,对不同生命周期植物的比较研究较少。
大豆所属的豆科(Fabaceae)植物,包含一年生和多年生的物种,是研究植物线粒体基因组复杂性和变异的理想对象。其中,一年生大豆如栽培大豆(G. max)及其野生祖先野生大豆(G. soja),是全球重要的农作物;多年生大豆则拥有许多优良性状,如高种子荚数、抗线虫和真菌病原体、耐旱耐盐等,可作为改良一年生作物的基因库。但目前,针对大豆线粒体基因组的系统研究资源有限,对其进化问题和基因组变异的分析还不够深入。
为了揭开大豆线粒体基因组的神秘面纱,广州大学广东省植物适应与分子设计重点实验室、南京林业大学以及中国农业科学院深圳农业基因组研究所的研究人员展开了深入研究。他们的研究成果发表在《BMC Plant Biology》上,为我们理解植物细胞器的复杂性、变异以及细胞内基因组整合的历史提供了重要线索。
研究人员主要运用了以下关键技术方法:首先,从中国国家生物信息中心(CNCB)和美国国立生物技术信息中心(NCBI)获取了 14 种一年生大豆和 6 种多年生大豆的 Pacbio 数据,以及绿豆(Vigna angularis)的线粒体和叶绿体基因组数据作为外群。然后,利用 Canu v2.2 软件对原始测序数据进行错误校正,再通过 PMAT v1.5.2 工具进行细胞器基因组的从头组装,并借助 Bandage v0.8.1 软件进行手动优化。之后,运用 PMGA 和 CPGAVAS2 在线平台分别对线粒体和叶绿体基因组进行注释,利用 Blastn v2.14.0 + 软件识别细胞内基因转移事件,最后通过 MAFFT v7.525、trimAl v7.525 和 IQ-TREE v2.2.0.3 等工具进行系统发育分析。
大豆细胞器基因组的特征
研究人员成功组装了 20 个大豆的细胞器基因组,涵盖多年生和一年生物种。结果发现,线粒体基因组大小差异明显,长度在 318,377bp 到 409,430bp 之间,GC 含量相对稳定,在 44.8% - 45.5% 之间。多年生大豆的线粒体基因组多为简单的环状结构,而一年生大豆的结构则十分复杂,野生大豆是复杂的大环,栽培大豆是复杂大环加上小环。相比之下,叶绿体基因组在结构、长度和 GC 含量上都高度保守,长度在 151,683bp 到 153,047bp 之间,GC 含量为 35.2 - 35.4%。
基因内容的保守性和密码子偏好
尽管不同大豆在 mitogenome 的大小和结构上有所差异,但蛋白质编码基因(PCGs)却高度保守,20 个 mitogenomes 都含有 31 个保守的 PCGs,不过部分多年生和一年生大豆分别缺失 cox2 和 nad4L 基因。rRNA 基因在所有样本中都包含 rrn5S、rrn18S 和 rrn26S 。tRNA 基因方面,一年生大豆较为保守,多年生大豆则差异显著,部分 tRNA 基因仅存在于多年生物种中。
在氨基酸和密码子使用分析中,两类大豆都含有 20 种氨基酸,使用频率相似,但多年生大豆的氨基酸总数略高。密码子偏好分析显示,多数大豆对 29 个密码子有较高偏好(RSCU>1),30 个密码子偏好较低(RSCU<1),AUG 和 UGG 无偏好(RSCU = 1)。
大豆中核质 DNA 和核线粒体 DNA 的分布特征
细胞内序列转移在细胞器基因组和核基因组之间频繁发生。研究发现,多年生大豆的核线粒体 DNA(NUMTs)片段数量更多,但长度较短;核质 DNA(NUPTs)片段数量也较多,除 Gfa 外,其他样本的 NUPTs 片段长度差异不明显 。多数 NUMTs 和 NUPTs 属于较新的转移类型,且集中在较短的片段范围内。
细胞内基因从细胞器向核的转移
对存在于 NUMTs 中的基因(NUMGs)分析发现,一年生大豆中 PCGs 和 rRNAs 完全整合到核基因组的比例较高,多年生大豆则以部分基因转移为主 。在 tRNA 方面,两种大豆差异不明显,部分 tRNA 在所有个体中都没有转移事件,部分则完全转移。
系统发育分析
通过基于 mitogenomes 和 plastomes 的保守 PCGs 构建最大似然树,研究人员发现,多年生大豆在两个树中都处于基部位置。但一年生大豆在线粒体 PCGs 和叶绿体 PCGs 构建的系统发育树中位置不同,这可能是由于线粒体和叶绿体的进化速率、遗传变异不同,以及基因转移、重组等因素的影响。
研究揭示了一年生和多年生大豆线粒体基因组的结构变异和进化模式。复杂的线粒体结构可能与重复序列的重组有关,基因内容的变异体现了 mitogenome 的动态变化,tRNA 系统的差异展示了其进化的灵活性,NUPTs 和 NUMTs 的转移模式则对基因组多样性和进化有重要意义。不过,该研究也存在一定局限性,未来还需要更广泛的物种比较和对转移序列功能的深入研究。这项研究为植物细胞器基因组的研究提供了重要参考,也为作物遗传改良和品种选育奠定了理论基础。
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》