微小植物中的巨型染色体——简单叶状苔类Apopellia endivifolia端粒到端粒完整基因组组装

《GigaScience》:Giant chromosomes of a tiny plant - the complete telomere-to-telomere genome assembly of the simple thalloid liverwort Apopellia endiviifolia (Jungermanniopsida, Marchantiophyta)

【字体: 时间:2025年11月30日 来源:GigaScience 3.9

编辑推荐:

  本研究通过牛津纳米孔长读长测序和Pore-C技术,首次完成了简单叶状苔类Apopellia endivifolia的单倍体基因组端粒到端粒(T2T)组装。该组装大小为2.91 Gbp,包含9条染色体、18个端粒和9个着丝粒,BUSCO完整性达99.2%。研究揭示了着丝粒区域Ty3/Gypsy反转录转座子的显著富集现象,为苔类植物基因组进化、着丝粒生物学和染色体结构演化提供了高质量参考基因组资源。

  
在植物进化长河中,苔藓植物作为最早登陆的先锋之一,承载着破解陆地植物适应性演化之谜的关键线索。其中,苔类植物Marchantiophyta更是以其古老的身份和独特的生物学特性,成为研究早期陆生植物基因组演化的理想模型。然而,尽管苔类植物种类繁多(超过80%的现存苔类属于Jungermanniopsida纲),但高质量的基因组资源却极为匮乏,特别是对于基因组巨大的简单叶状苔类,其染色体结构和基因组进化机制更是迷雾重重。
Apopellia endivifolia作为一种分布广泛的简单叶状苔类,不仅表现出惊人的生态适应性(从水生环境到石灰岩干旱生境),还展现出典型的隐存物种形成现象。更引人注目的是,其基因组大小高达3,364.0 Mbp,远高于大多数苔藓植物(苔类平均1,844 Mbp,苔藓平均504 Mbp)。这些特征使得A. endivifolia成为研究苔类植物基因组扩张和染色体进化的绝佳体系。然而,由于技术限制,此前一直缺乏染色体水平的完整基因组组装,特别是着丝粒、端粒等重复区域的解析更是难以突破。
为了解决这一难题,研究人员采用牛津纳米孔PromethION 2平台进行长读长测序,结合Pore-C三维基因组技术,成功获得了A. endivifolia单倍体基因组的端粒到端粒完整组装。该组装总长2,914,960,273 bp,contig N50达到76.6 Mbp,scaffold N50高达468.2 Mbp,仅含6个缺口。通过BUSCO评估显示基因组完整性达99.2%(Viridiplantae数据集),共识质量值(QV)为47.6,LTR组装指数(LAI)为20.06,证明组装质量极高。
研究团队建立了来自波兰Lyna河源自然保护区的A. endivifolia无菌培养体系,采用改良的超长DNA提取方法获得高质量DNA。利用Dorado v0.9.1进行碱基识别,Hifiasm v0.25.0进行初始组装,再通过YaHS v1.2.2结合Pore-C数据进行染色体尺度支架构建。基因组注释采用NCBI EGAPx流程,整合了来自水生型、陆生型、精子器及周围叶状体的RNA-seq数据。重复序列分析使用EDTA v2.2.2和TESorter,着丝粒和端粒识别采用quarTeT和CentIER工具。
基因组组装质量评估
通过多维度评估证实了组装的高质量。Pore-C相互作用热图显示所有染色体均具有高度一致性,BUSCO评分显示Viridiplantae_odb10和Eukaryota_odb10的完整性分别为99.2%和95.5%。LTR完整性评估(LAI)为20.06,共识质量值(QV)达到47.6,这些指标共同证明了组装的准确性和可靠性。
基因注释与功能分析
基因组注释共识别出34,615个基因,其中33,513个为蛋白质编码基因。基因本体(GO)术语分析显示,"生物过程"类别包含最多的独特术语(96个,占45.1%),"分子功能"和"细胞组分"分别占31%和23.9%。显著富集的GO术语包括"poly(A)+ mRNA从核输出"、"乙烯激活信号通路"、"双链DNA结合"等,反映了该物种特有的生物学特征。
转座元件组成特征
转座元件(TE)分析显示,LTR元件占基因组的12.16%,其中Copia和Gypsy超家族分别占8.94%和2.95%。此外还鉴定出57个Helitron元件。系统发育分析揭示了LTR反转录转座子家族的多样性和进化关系,包括Athila、Phygy、Tekay等主要谱系。
端粒和着丝粒特征
研究成功识别了18个端粒和9个着丝粒。大多数染色体两端都含有典型的端粒重复序列,重复次数在352-481之间。然而,染色体3的左端和染色体6的右端出现了非典型端粒样重复序列(分别为ACGCAGC和TGCGTCG motif)。着丝粒长度在1.9-5 Mbp之间,显著大于其他苔类植物(如Marchantia polymorpha着丝粒为176-604 Kbp)。分析发现着丝粒区域富含Ty3/Gypsy超家族的LTR元件,特别是Tat(TatI、TatII、TatIII)、Phygy和Selgy家族显著富集。
基因组共线性分析
与Jungermanniopsida纲的另一个苔类Herbertus hutchinsiae的比较基因组分析显示,两者之间存在复杂而分散的共线性模式,共检测到429个共线性区块,中位大小约5.2 kb,表明基因组间存在大量重排。与模式苔类Marchantia polymorpha的比较则未发现显著共线性,反映了苔类植物基因组的快速进化。
系统发育分析
基于13个苔类物种的单拷贝直系同源基因构建的系统发育树,清晰地将Marchantiopsida和Jungermanniopsida分为不同的进化谱系,所有内部节点均获得100%的自举值支持。基因组大小变异分析揭示了Jungermanniopsida谱系特有的基因组动态特征。
这项研究首次提供了简单叶状苔类A. endivifolia的高质量端粒到端粒基因组组装,填补了苔类植物基因组资源的重要空白。研究不仅揭示了该物种巨大的基因组规模和复杂的染色体结构特征,更重要的是阐明了着丝粒区域转座元件的特异富集模式,为理解苔类植物基因组进化提供了新的视角。特别值得注意的是,着丝粒中Ty3/Gypsy元件的显著富集与其他苔类植物(如M. polymorpha的简单卫星重复和Physcomitrium patens的Copia元件富集)形成鲜明对比,表明苔类植物着丝粒进化具有多样性。
该基因组资源的发布将为后续研究提供重要基础,包括染色体结构和功能研究、着丝粒生物学机制探索、苔类植物适应性进化分析等。研究中发现的非典型端粒样重复序列也为植物端粒进化研究提供了新的线索。作为发表在《GigaScience》上的重要成果,这项研究不仅推动了苔类植物基因组学领域的发展,也为整个陆生植物进化研究提供了宝贵的数据资源和方法学参考。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号