基于牛津纳米孔长读长ITS代谢条形码的真菌物种分类基准研究

《Fungal Genetics and Biology》:Benchmarking fungal species classification using Oxford nanopore technologies long-read ITS metabarcodes

【字体: 时间:2025年10月26日 来源:Fungal Genetics and Biology 2.3

编辑推荐:

  本综述系统评估了Oxford Nanopore Technologies(ONT)长读长测序在真菌ITS代谢条形码分类中的应用,通过对比八种算法(包括比对、k-mer及机器学习方法),证明基于参考数据库设定动态相似性阈值的分类器在物种水平鉴定中具有更高准确性、一致性及对"未知"物种的溯源能力,为病原检测和生态多样性研究提供了可靠技术路径。

  
亮点
我们使用来自双核亚界54种真菌的真实ONT长读长代谢条形码模拟群落,全面评估了物种水平分类方法的性能。通过比较八种涵盖比对算法、k-mer搜索及新兴机器学习方法的分类器,重点分析了各方法在物种水平的灵敏度、精确度和多样性评估能力。
in silico模拟群落用于真菌ITS分类基准测试
我们通过in silico方式构建了三个模拟群落(均匀分布群落、非均匀分布群落、含低丰度病原体的群落),以评估不同分类方法对ONT长读长ITS序列的物种鉴定和群落特征分析能力。这些群落基于"通用"ITS引物扩增获得的长读长序列,覆盖ITS1、ITS2及18S SSU和28S LSU基因部分区域。
讨论
本研究对八种分类方法(包括比对算法minimap2、Emu、Dnabarcoder,k-mer方法Kraken2、aodp,以及机器学习模型mycoAI CNN/BERT和'vtd' CNN)进行了系统性基准测试。结果显示,基于参考数据库生成动态相似性阈值的分类器(如Kraken2和Dnabarcoder)在物种水平鉴定中表现出更高精确度,能更准确地还原物种丰度分布,并对未收录物种实现更合理的分类溯源。机器学习方法在充分训练数据支持下,展现出利用全长ITS代谢条形码区分真菌物种的强大潜力。
结论
本研究证实,基于ONT长读长ITS代谢条形码的真菌物种水平分类鉴定具有高精确度和可靠性。特别当序列包含保守核糖体基因区域时,采用动态相似性阈值策略的分类器表现最优。机器学习方法虽依赖训练数据质量,但为长读长序列分类提供了新范式。该研究为临床诊断、生态多样性监测等应用场景提供了关键技术支撑。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号