马甲子T2T单倍型基因组揭示鼠李科进化与抗病/抗逆分子机制
《Communications Biology》:Haplotype-resolved t2t genome of paliurus hemsleyanus provides insights into rhamnaceae evolution and genome biology
【字体:
大
中
小
】
时间:2025年12月05日
来源:Communications Biology 5.1
编辑推荐:
本研究针对鼠李科重要树种马甲子(Paliurus hemsleyanus)基因组资源匮乏的问题,通过PacBio HiFi+ONT+Hi-C技术构建了首个单倍型分型的T2T无间隙基因组(两个单倍型分别为306.65/306.21 Mb)。研究发现鼠李科基因组结构相对稳定,NLR抗病基因呈现根组织优势表达模式,等位基因表达与序列变异正相关;抗坏血酸代谢基因在叶片高表达,MDHAR基因家族在鼠李科发生谱系特异性串联扩增。该高质量基因组为鼠李科进化研究和分子育种提供了关键资源。
在植物基因组学研究日新月异的今天,鼠李科植物作为重要的经济树种和生态树种,其基因组资源却相对匮乏。马甲子(Paliurus hemsleyanus)作为中国特有落叶灌木或小乔木,不仅具有生态韧性、经济价值和观赏价值,更是枣树(Ziziphus jujuba Mill.)的优选砧木,能显著提高接穗对枣疯病的抗性。然而,由于缺乏高质量的基因组参考序列,人们对该物种的基因组生物学和进化历史的认识一直受限。
为了解决这一难题,河北农业大学的研究团队在《Communications Biology》上发表了最新研究成果。他们采用多种前沿测序技术,成功构建了马甲子单倍型分型的端粒到端粒无间隙基因组,为鼠李科植物进化研究和功能基因组学分析提供了高质量参考。
研究人员首先通过PacBio HiFi、Oxford Nanopore超长读长和Hi-C技术,构建了两个单倍型基因组(HapA 306.66 Mb,HapB 306.21 Mb),contig N50均超过24.9 Mb。评估显示基因组完整性达98.90%,LAI指数超过18.5,QV值高于51.4,证实了组装的高质量。所有着丝粒和端粒区域均被完整预测,共注释到约29,000个蛋白编码基因。
通过整合多组学数据,研究人员成功将contig锚定到12条染色体上,Hi-C互作图谱显示清晰的染色体对角线信号。BUSCO分析显示两个单倍型均具有98.90%的完整性,Merqury评估显示碱基错误率低于0.0001。着丝粒预测显示其大小为100 kb-2 Mb,主要由LTR反转录转座子主导。
重复序列占基因组的47.37%-47.57%,其中转座元件(TE)是主要组成部分。Gypsy和Copia是含量最丰富的LTR反转录转座子。基因表达分析显示,约66%的基因在至少一个组织中表达,表达模式在两个单倍型间高度相似。
共鉴定到1,295,745个SNP和348,631个Indel,影响66.66%的蛋白编码基因。等位基因特异性表达(ASE)分析发现829对基因存在显著表达差异,这些基因富集于防御反应和应激相关过程。表达差异与序列变异程度呈正相关,启动子区域变异对表达影响尤为显著。
特别值得注意的是精氨酸琥珀酸合酶基因ASS1的等位变异:HapA中的PhAASS1具有功能,而HapB中的等位基因因第一外显子插入285 bp而失活。这一发现揭示了结构变异如何驱动等位基因特异性表达,进而影响代谢灵活性。
与19个物种的比较基因组分析显示,鼠李科物种保持12条染色体的稳定核型,而蔷薇科物种染色体数目变异较大。Ks和4DTv分析揭示了共享的古代全基因组三倍化事件(γ事件),以及蔷薇科和胡颓子科中特异的全基因组复制事件。鼠李科物种仅保留较小的物种特异性复制峰,表明其基因组进化相对保守。
共鉴定到853个NLR基因,分为CNL、NL、TNL和RNL四个亚家族。表达分析显示NLR基因在根组织中优势表达,特别是在中等表达水平(FPKM 10-100)范围内。等位NLR基因的表达显著高于非等位基因,表明保留两个单倍型具有转录优势。
转座元件分析显示,与全基因组模式不同,Copia元件在NLR基因周围占主导地位。TNL亚家族携带的TE数量显著多于其他亚家族,且TE丰度与TNL在茎叶中的表达呈负相关,但在根中无此相关性,提示根组织可能存在特异性调控机制。
HapB染色体9上约246 kb的缺失导致13个串联NLR基因丢失,这些基因完全不表达,为非等位NLR表达降低提供了典型案例。鼠李科物种间NLR库比较显示显著变异,其中Sth物种的NLR数量极少(68个),但RNL数量与马甲子相当,表明RNL在鼠李科中具有独特的进化轨迹。
鉴定到91个AsA代谢相关基因,其中L-半乳糖和D-半乳糖醛酸途径在根、茎、叶中占主导地位。生物合成基因在茎叶中的平均表达显著高于根,与AsA含量测定结果一致(叶片含量最高)。
MDHAR基因家族在鼠李科中发生谱系特异性串联扩增,其中枣树扩张最为显著(13个基因)。比较分析显示,这种扩张模式为鼠李科特有,其他高AsA物种如猕猴桃和柑橘中未见类似扩张。
本研究提供的马甲子单倍型分型T2T基因组填补了鼠李科基因组资源的空白。研究发现鼠李科基因组结构相对稳定,NLR基因呈现根组织优势表达模式,等位基因表达与序列变异正相关。AsA代谢在叶片中最为活跃,MDHAR基因家族的谱系特异性扩张可能增强了鼠李科植物的抗逆能力。
该基因组为鼠李科植物的进化研究、功能基因组学和分子育种提供了宝贵资源,对未来比较基因组学研究和育种策略制定具有重要指导意义。特别是对NLR和AsA代谢基因的深入分析,为理解植物抗病抗逆机制提供了新视角。
研究采用PacBio HiFi(41.7×)、Oxford Nanopore超长读长(180×)和Hi-C(201×)技术进行基因组测序,使用MGISEQ-2000平台进行基因组长短读长测序(71×)。利用改进的CTAB法从年轻叶片提取基因组DNA,从同一马甲子个体的根、茎、叶组织(各3个生物学重复)提取RNA进行转录组测序。通过Hi-C数据辅助染色体构建,使用BUSCO、Merqury和LAI指数评估基因组质量。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号