编辑推荐:
为解决洋葱基因组组装困难及注释不完善问题,韩国国立农业科学院的研究人员开展洋葱(Allium cepa L.)基因组相关研究,成功完成双单倍体洋葱 DHW30006 基因组的染色体水平组装与注释优化,为葱属植物育种和生物学研究提供重要资源。
在蔬菜的世界里,洋葱(Allium cepa L.)可是一位 “明星选手”。它不仅是人们餐桌上常见的食材,为各种美食增添独特风味,还富含多种对人体有益的营养成分和药用化合物,具有抗氧化、抗炎、抗肿瘤、降低胆固醇和血压以及抗菌等诸多功效,从古埃及时代起就被人类广泛种植和食用。然而,洋葱那庞大且富含重复序列的基因组,却如同一个神秘而复杂的迷宫,让科研人员在探索的道路上困难重重。
洋葱的基因组大得惊人,二倍体洋葱(
)的基因组大小约为
,平均每条染色体大小约 2Gb,和整个玉米基因组(2.2Gb)差不多大。而且,在洋葱基因组中,重复序列至少占据了 95% 的地盘,这使得基因在基因组中分布得极为稀疏。曾经对洋葱细菌人工染色体(BAC)克隆的测序发现,有的 95Kb 的 BAC 克隆(如 S1 - D12 克隆)上竟然没有基因,而在另一个 110Kb 的 BAC 克隆(1G - 12–89 克隆)上也仅有一个基因。由于基因组的高重复含量和高杂合性,洋葱基因组的测序和组装工作一直是基因组学领域的一大挑战,严重限制了洋葱的分子育种和生物学研究。
为了攻克这一难题,韩国国立农业科学院(National Institute of Agricultural Sciences, RDA)等机构的研究人员展开了深入研究。他们的研究成果为洋葱及其他葱属植物的研究开辟了新的道路,具有重要的意义。
研究人员在此次研究中运用了多种先进技术。在测序技术方面,综合运用了 PacBio 长读长测序、Illumina 短读长测序以及高通量染色体构象捕获(Hi - C)技术。PacBio Sequel II 系统用于产生长读长序列,Illumina NovaSeq 6000 平台进行短读长测序,Hi - C 技术则用于基因组的支架构建。此外,还通过 Iso - Seq 和 mRNAseq 进行基因预测,获取不同组织的 RNA 用于后续分析。在基因组组装和注释过程中,使用 FALCON - Unzip assembler 进行从头组装,利用 Pilon 软件结合 Illumina 短读长数据进行纠错,运用 RepeatModeler 和 RepeatMasker 对重复序列进行建模和屏蔽,采用多种工具进行基因预测和功能注释等。
研究结果
- 基因组组装:研究人员成功完成了双单倍体(DH)洋葱品系 DHW30006 的染色体水平基因组组装。该基因组总大小为 12.77Gb,包含 60,552 个重叠群(contig),重叠群 N50 长度达 307Kb。基于 Hi - C 数据,将注释的重叠群有序排列到 8 条假染色体上,覆盖了 12.07Gb(94.5%)的基因组,支架 N50 达到 1.40Gb。
- 基因预测与注释:预测出 65,730 个基因模型,这些基因的平均长度为 8,827bp,每个基因平均含有 5.48 个外显子。对基因功能进行注释后发现,大量基因在 NCBI nr、SwissProt、KEGG 等数据库中都有注释信息。研究还发现,洋葱基因组中重复序列占比高达 76.9%,其中长末端重复序列(LTR)元件尤为丰富,占 44.9%,特别是 Gypsy 家族的 LTR 元件,长度达到 4.5Gb。此外,还注释出 1,258 个 rRNA 和 12,738 个 tRNA ,总长度为 1.24Mb。
- 比较分析:通过对洋葱和大蒜基因组进行共线性分析,发现二者具有高度的共线性。对洋葱和大蒜完整的 LTR - RT 重复序列进行插入时间估算,结果表明在过去 200 万年中,LTR 的积累可能是导致洋葱基因组增大的原因。
- 技术验证:利用 BUSCO 分析评估基因组组装质量,以 viridiplantae_odb10 和 embryophyte_odb10 数据库为参考,完整 BUSCO 分数分别达到 95.6% 和 91.4%。通过与构建连锁图谱的标记进行比较,发现 DHW30006 基因组与连锁图谱的共线性为 84.4%。利用 Merqury 评估 k - mer 完整性和质量值(QV),k - mer 完整性分数为 88.96%,QV 值为 35.03。计算 LTR 组装指数(LAI),得分达到 22.91,这些结果均表明该基因组组装质量较高。
研究结论与意义
这项研究成功完成了洋葱 DHW30006 基因组的染色体水平组装和注释优化,所获得的高质量基因组序列和基因模型,为葱属植物的基因组分析、分子育种以及生物学研究提供了宝贵的资源。通过与大蒜基因组的比较分析,有助于深入了解葱属植物的基因组进化历程。同时,精确的基因组信息也为挖掘洋葱重要农艺性状相关基因、开展分子标记辅助育种提供了有力支持,有望加速培育出更优质、高产、抗逆性强的洋葱品种,对葱属植物产业的发展具有重要的推动作用。此外,研究中所运用的技术方法和分析流程,也为其他大基因组植物的研究提供了有益的参考和借鉴。
总的来说,该研究成果在洋葱及葱属植物研究领域取得了重要突破,为后续深入探索葱属植物的奥秘奠定了坚实基础。