编辑推荐:
为解决山药参考基因组存在 500 多个组装缺口,可能遗漏重要基因的问题,研究人员开展了对紫芋参薯(Dioscorea alata cultivar ziyushenshu)端粒到端粒(T2T)无间隙基因组的研究。结果获得了 511.5Mb 的无间隙基因组,还对相关基因和进化进行分析。这为山药科研及分子育种提供了关键资源。
山药,这种在热带和亚热带地区广泛种植的作物,有着颇高的经济价值,其块茎富含淀粉和粗蛋白,是当地重要的粮食来源。全球 2021 年山药块茎产量达 7500 万吨,庞大的产量背后,却是山药科研与育种面临的困境。以往的研究虽然借助已发表的染色体水平基因组,探索了山药品质性状和抗病相关的基因 / 位点,比如发现了三个炭疽病抗性数量性状位点(QTLs) ,但已发表的参考基因组存在超过 500 个组装缺口,这意味着可能有重要的核苷酸结合位点富含亮氨酸重复序列(NLR)基因和农艺基因被遗漏在这些缺口区域。若想深入了解山药的遗传奥秘,实现更高效的分子育种,获取完整的基因组并进行全面的基因注释迫在眉睫。
在这样的背景下,江苏省中国科学院植物研究所、南京农业大学园艺学院、南京大学生命科学学院等研究机构的研究人员联合开展了一项意义重大的研究。他们的研究成果发表在《Plant Communications》上,为山药研究领域带来了新的曙光。
研究人员为了攻克山药基因组组装难题,采用了多种先进的技术方法。首先,利用 25Gb 的 PacBio 高保真(HiFi)长读长测序数据,生成了包含 38 个重叠群(contig)、大小为 508Mb 的初始组装结果。接着,借助 Hi-C 数据辅助搭建支架,成功将所有 contig 锚定到 20 个支架上,对应 20 条假染色体。之后,运用来自牛津纳米孔技术平台的 155Gb 纳米孔测序数据,包括 18.7Gb 的超长读长数据,填充组装过程中的缺口。研究人员没有采用提取超长读长跨越缺口的常规方法,而是通过不同工具对纳米孔数据进行从头组装,得到多个纳米孔组装结果,最终获得了大小为 511.5Mb 的无间隙基因组。同时,研究还结合了多个器官 / 组织的 RNA 测序(RNA-seq)数据进行基因注释。
研究结果如下:
- 高质量基因组组装:成功构建了紫芋参薯的 T2T 无间隙基因组,其大小为 511.5Mb,大于之前发表的 480Mb 基因组,且与流式细胞术和 k-mer 分析的估计结果更相符。PacBio HiFi 和纳米孔测序数据的比对率均高达 99.99%,证明了该基因组的高保真度和完整性。所有 20 条假染色体的端粒和着丝粒都被识别出来,端粒长度在 469bp 到 16.7kb 之间,平均长度为 4.7kb;着丝粒长度在 105.3kb 到 6854.3kb 之间,平均长度为 1786.717kb 。
- 基因注释与重复序列分析:通过 BUSCO(embryophyta_odb10)评估,基因组组装和注释分别捕获了 97.78% 和 95.3% 的完整基因。注释发现基因组中 62.58% 为重复序列,其中 DNA 转座子和逆转录元件分别占基因组的 4.59% 和 23.27%。结合 RNA-seq 数据,新组装基因组注释出 30781 个蛋白质编码基因,比之前发表的非洲栽培品种 D 基因组多约 5574 个。
- 染色体进化分析:通过对同义替换位点(Ks)分布的研究,发现三种薯蓣属物种在分化之前经历了两轮共享的全基因组复制。基于最大简约法和共线性比较,重建出三种物种的共同祖先拥有 19 条单倍体染色体,并推断出薯蓣属的核型进化过程。圆叶薯蓣(D. rotundata) - 参薯(D. alata)谱系除一次单染色体断裂事件外,保留了所有祖先核型;而姜状薯蓣(D. zingiberensis)谱系则经历了多次融合事件,染色体数目减少到 10 条。
- NLR 基因研究:利用 T2T 基因组,系统鉴定了紫芋参薯中的 NLR 家族基因,共识别出 432 个 NLR 基因,比之前发表的 D. alata 基因组多 100 个,其中 4 个位于着丝粒和缺口区域。92.8% 的 NLR 基因在染色体上形成基因簇,仅有 32 个为单拷贝基因。T2T 基因组中注释出 190 个完整的 NLR 基因,编码完整的卷曲螺旋 / 富含亮氨酸重复蛋白(CC/RPW8)、核苷酸结合位点(NBS)和富含亮氨酸重复序列(LRR)结构域,多于非洲栽培品种的 138 个。通过分析接种胶孢炭疽菌(C. gloeosporioides)前后的转录组数据,鉴定出 10 个响应病原菌入侵显著上调的 NLR 基因,分别位于 3、7、8、12 和 13 号染色体上。对这些基因进行 BLASTp 搜索分析发现,8 个受 C. gloeosporioides 诱导的 NLR 基因与已知功能的 NLR 抗性基因具有较高的氨基酸序列相似性。系统发育分析表明,4 个受 C. gloeosporioides 诱导的 NLR 基因在 D. alata 中近期发生了复制,其中 2 个在紫芋参薯中特异性复制,这体现了近缘物种甚至同一物种不同品种间 NLR 基因库的分化。
研究结论和讨论部分强调了该研究的重要意义。此次获得的 T2T 无间隙基因组为山药的科学研究提供了完整的参考基因组,大大提高了基因注释的全面性和准确性,尤其是对 NLR 基因家族的注释。这不仅有助于深入理解山药的遗传进化机制,还为分子育种培育抗病品种提供了关键的基因资源。尽管目前由于缺乏成熟的功能验证体系,部分候选基因无法通过实验验证,但这些潜在的 NLR 基因在未来的山药育种中具有重要的参考价值,有望通过育种实践来验证其功能。未来将不同来源的基因组资源整合,将进一步推动山药分子育种的发展,为解决全球粮食安全问题贡献力量。这项研究为山药领域的科研工作者提供了宝贵的资源和新的研究思路,在山药的遗传改良和农业生产应用方面具有广阔的前景。