丹麦土壤与沉积物纳米孔测序揭示15,000种微生物新物种:原核生物系统发育多样性扩展8%

【字体: 时间:2025年07月25日 来源:Nature Microbiology 20.5

编辑推荐:

  本研究通过深度纳米孔长读长测序(Nanopore sequencing)结合定制化mmlong2流程,从154份丹麦土壤/沉积物样本中成功回收15,314个未描述微生物物种基因组(MAGs),新增1,086个属级分类单元,将原核生物系统树分支长度扩展8.1%。该研究突破性地解决了高复杂度环境样本的基因组组装难题,首次实现土壤生态系统中完整核糖体RNA操纵子(rRNA operons)、生物合成基因簇(BGCs)和CRISPR-Cas系统的规模化捕获,显著提升公共数据库对土壤宏基因组数据的物种级分类率(中位数从3.0%提升至36.6%)。

  

基因组解析的长读长测序拓展陆地生境微生物多样性认知

摘要
高通量长读长DNA测序技术的出现使得环境样本中微生物基因组的规模化回收成为可能。丹麦"Microflora Danica"项目对154份土壤和沉积物样本进行深度纳米孔测序,通过定制化mmlong2工作流程获得15,314个未描述微生物物种的基因组。这些基因组涵盖1,086个新属,将原核生物系统发育多样性扩展8%。长读长组装还实现了数千个完整核糖体RNA操纵子、生物合成基因簇和CRISPR-Cas系统的回收。将这些基因组纳入公共数据库后,土壤和沉积物宏基因组数据的物种级分类率显著提升。

主体内容
传统微生物基因组获取依赖分离培养,但绝大多数微生物难以培养。宏基因组组装基因组(MAGs)技术虽能规避培养限制,但土壤等高复杂度样本始终是"宏基因组学重大挑战"。本研究开发的mmlong2工作流程整合多重优化:

  1. 多样本差异覆盖度分箱(differential coverage binning)
  2. 集成四种分箱工具(MetaBAT2/SemiBin2/GraphMB/DAS Tool)的集成分箱(ensemble binning)
  3. 迭代分箱策略(iterative binning)

14.4 Tbp测序数据(中位深度94.9 Gbp/样本)产生295.7 Gbp重叠群,N50达79.8 kbp。最终获得23,843个MAGs(6,076高质量HQ-MAGs),经去冗余得到15,640个物种级基因组,其中97.9%代表新分类单元。

关键发现

  1. 基因组质量突破:82% MAGs含完整16S rRNA基因,与Microflora Global数据库比对显示97.2%可归类至属级。
  2. 分类学贡献:新增1个门、21个目、91个科,使Actinomycetota(+42.1%)、Chloroflexota(+38.5%)等门类物种数显著增长。
  3. 功能元件捕获:相比短读长研究,长读长数据实现:
    • 完整rRNA操纵子回收率提升6.1倍
    • 完整CRISPR-Cas系统增加14.8倍
    • 生物合成基因簇(BGCs)完整性显著提高

典型新物种
从贫营养湖泊样本中获得的2.9 Mbp环状基因组代表新门类Oederibacterium danicum sp. nov.,具有:

  • 核糖单磷酸途径(ribulose monophosphate pathway)
  • 乙醇胺利用微区室(ethanolamine bacterial microcompartment)
  • 群体3b型NiFe氢化酶(group 3b NiFe hydrogenase)

应用价值

  1. 将丹麦土壤宏基因组物种注释率从17.3%提升至36.8%
  2. 为682个GTDB中"单基因组属"提供高质量参考
  3. 建立207个新属的命名体系(按SeqCode规范)

讨论
研究揭示了农业土壤(低优势种、高微多样性)与海岸生境(高优势种、低微多样性)的基因组回收效率差异。通过甲基化分箱等新兴技术,未来可进一步解析多组分基因组(multipartite genomes)。该成果为挖掘土壤微生物资源提供了范式,其工作流程已开源(github.com/Serka-M/mmlong2)。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号