黑腹果蝇Canton S品系近完整基因组组装揭示结构变异与嗅觉基因功能

《Nature Communications》:Near complete assembly of Drosophila melanogaster Canton S strain genome

【字体: 时间:2025年12月04日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对黑腹果蝇(Drosophila melanogaster)参考基因组(ISO-1品系)在复杂区域存在未解析缺口的问题,研究人员通过整合PacBio HiFi、Oxford Nanopore超长读长和Hi-C数据,成功构建了Canton S品系雄性果蝇的近完整端粒到端粒(T2T)基因组组装(Dm.nT2T)。该组装大小为161.63 Mb,闭合了当前参考基因组93.28%的缺口,并鉴定出着丝粒和端粒区域。研究发现7,989个结构变异(SVs),首次在果蝇中发现SINE转座子,并通过功能验证证实Chr3L.2449基因对嗅觉敏感性至关重要。这项研究为探索果蝇基因组复杂性、品系多样性和基因功能提供了高质量资源,对理解基因组进化具有重要意义。

  
作为生物学研究中最经典的模式生物之一,黑腹果蝇(Drosophila melanogaster)在遗传学、神经科学和发育生物学等领域发挥着不可替代的作用。然而,尽管科学家们对其基因组的研究已持续数十年,当前参考基因组(ISO-1品系)仍存在约250个未解析缺口,这些缺口主要分布在结构复杂的区域,如着丝粒和端粒等重复序列区域。这些区域的缺失限制了我们全面解析基因组功能景观的能力,也阻碍了对品系间遗传差异的深入理解。
随着长读长测序技术的突破,科学家们已经能够构建从端粒到端粒(Telomere-to-Telomere, T2T)的完整基因组组装,人类基因组的T2T组装就是这一领域的里程碑成就。受此启发,由云南大学孙艳波教授和昆明动物研究所吴东东研究员领导的研究团队,在《Nature Communications》上发表了题为"Near complete assembly of Drosophila melanogaster Canton S strain genome"的研究论文,报道了黑腹果蝇Canton S品系的近完整T2T基因组组装。
研究人员采用多技术整合策略,结合PacBio HiFi环形共识序列(CCS)测序(107.39×覆盖度)、Oxford Nanopore Technology(ONT)超长读长测序(966.74×覆盖度)、Illumina短读长测序(149.37×覆盖度)和Hi-C测序数据(190.8×覆盖度),通过NextDenovo进行从头组装,并利用Nextpolish进行多轮抛光,最终获得包含7条染色体的高质量基因组组装。
高质量基因组组装的特征
研究团队获得的Dm.nT2T基因组组装大小为161.63 Mb,比当前参考基因组R6大17.93 Mb,contig N50达到21.93 Mb,成功闭合了93.28%的R6缺口。质量评估显示,该组装的k-mer完整性为98.0%,QV值为40.24,BUSCO分析显示98.8%的完整性,略高于R6参考基因组。特别值得注意的是,研究人员成功解析了核糖体DNA(rDNA)阵列和组蛋白基因簇等传统上难以组装的区域。在Dm.nT2T中,18S、5.8S和28S rDNA序列被精确定位到X染色体和Y染色体上,而R6基因组中Y染色体的rDNA簇未被注释。组蛋白基因簇在2L染色体上的组装区间从R6的21.4-21.5 Mb扩展到21.4-22.1 Mb,显示了在重复序列解析方面的显著改进。
重复序列与结构变异分析
Dm.nT2T基因组中重复序列含量为30.57%,其中转座元件(TEs)占22.79%,略高于R6基因组的21.7%。研究人员发现了所有主要类型的TEs,包括DNA转座子(3.98%)、长末端重复序列(LTRs, 11.91%)、长散布核元件(LINEs, 6.87%)和短散布核元件(SINEs, 0.02%)。特别引人注目的是SINE元件的发现,因为先前的研究和文献并未报道其在黑腹果蝇中存在。通过与已知的DINE-1和suffix元件比较,发现这些SINE序列与它们相似度很低(16-30%),表明它们代表了黑腹果蝇中一个独立的进化谱系。
通过与R6参考基因组的比较,研究团队共鉴定出7,989个结构变异(SVs),包括2,862个插入(INSs)、3,208个缺失(DELs)、242个重复(DUPs)、203个倒位(INVs)和1,474个易位(TRAs)。这些SVs在所有常染色体的端粒区域、X染色体的一端以及Y染色体全染色体富集,其中79.57%的INDELs长度超过100 bp。功能注释显示,大多数SVs位于基因间区(46.7%)和内含子区(38.2%),只有4.2%位于外显子区。
端粒和着丝粒区域的表征
黑腹果蝇的端粒结构与其他真核生物显著不同,它们不是由端粒酶维持,而是通过三种特殊逆转录转座子(HeT-A、TART和TAHRE)的靶向转座来延长。研究人员在Dm.nT2T组装中鉴定出所有染色体的端粒区域,发现其端粒转座子组成比R6参考基因组更为复杂,除了HeT-A外,还包含TART、TAHRE和HETA_DSi等多种转座子家族。
对于着丝粒区域,研究人员采用串联重复查找器(TRF)和StainedGlass可视化相结合的方法,发现黑腹果蝇的着丝粒主要由5-12 bp的卫星重复序列构成,其中5-bp重复最为丰富,有290,576个拷贝,约占基因组的0.9%。通过整合CENP-A ChIP-seq数据验证,最终确定了各条染色体的着丝粒区域,长度从4号染色体的35.3 kb到X染色体的2.6 Mb不等,平均长度为920 kb。转座子分布分析显示,着丝粒区域主要富含Jockey、CR1、R1、Copia、Gypsy、Pao和Helitron等七种类型的转座子。
基因注释完善与新基因发现
通过多证据整合方法,研究团队在Dm.nT2T基因组中注释了17,898个基因,其中发现了213个潜在的新基因。通过相互最佳命中(RBH)分析和转录组验证,最终确认了92个新基因,其中74个被预测为蛋白质编码基因。这些基因在染色体上分布不均,约63%位于3R染色体上,而在性染色体上分布极少。
为了验证这些新基因的生物学功能,研究人员选择了两代表性基因Chr2R.722和Chr3L.2449进行功能验证。通过CRISPR/Cas9技术引入移码突变,发现Chr3L.2449基因敲除后果蝇的嗅觉能力显著受损。在Y型管嗅觉选择实验中,突变体果蝇对厌恶气味剂3-Octanol(OCT)的反应明显弱于对照组,表明该基因在嗅觉功能中发挥关键作用。
研究意义与展望
Dm.nT2T基因组的发布标志着果蝇基因组学研究进入了一个新阶段。这项研究不仅解决了长期存在的基因组缺口问题,还揭示了品系特异的遗传变异,特别是着丝粒和端粒区域的完整表征为理解染色体生物学提供了新见解。SINE转座子的发现挑战了我们对果蝇转座子组成的传统认知,而新基因的功能验证则展示了完整基因组组装在发现功能元件方面的重要价值。
尽管Dm.nT2T组装取得了显著进展,但仍存在一些局限性。例如,Y染色体的组装长度(6.27 Mb)与之前报道的14.6 Mb存在差异,这可能反映了品系特异性差异或组装挑战。此外,与估计的基因组大小(117-205 Mb)相比,当前组装仍有约54 Mb的差距,这可能源于残留的异染色质区域或品系特异性变异。
未来研究需要整合更多个体和品系的长读长测序数据,结合转录组和表型分析,以全面揭示这些结构变异的功能和进化意义。Dm.nT2T基因组的发布为果蝇生物学研究提供了宝贵资源,将推动我们对基因组结构、功能和进化的理解迈向新的高度。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号