CholeraSeq:用于霍乱监测和近实时疫情调查的综合性基因组学流程

《Bioinformatics》:CholeraSeq: a comprehensive genomic pipeline for cholera surveillance and near real-time outbreak investigation

【字体: 时间:2025年12月17日 来源:Bioinformatics 5.4

编辑推荐:

  本研究针对霍乱监测中缺乏端到端可重复基因组分析流程的问题,开发了基于Nextflow的CholeraSeq流程。该工具整合了读长质控、变异检测、重组筛选和系统发育分析等功能,通过预构建的全球核心基因组比对库,实现了新发疫情毒株的快速溯源定位,显著提升了公共卫生应急响应效率。

  
在霍乱第七次大流行的背景下,全基因组测序(WGS)已成为疫情调查的关键技术。然而,在资源有限地区,分析过程的工具不一致性和操作复杂性严重阻碍了基因组数据的实时转化。现有流程往往需要繁琐的手动干预,难以应对突发疫情中对新毒株进行快速系统发育定位的需求。
为此,研究团队开发了CholeraSeq——一个专为霍乱监测设计的自动化基因组学流程。该工具基于Nextflow工作流管理器构建,采用模块化设计,支持从原始测序数据到高质量SNP和系统发育树的端到端分析。特别值得一提的是,研究人员还配套发布了包含4,196个全球霍乱弧菌菌株的核心基因组比对数据库,使新样本能够快速嵌入全球进化背景进行分析。
关键技术方法包括:基于fastp的读长质控与适配体修剪,使用Snippy进行参考基因组映射和变异调用,通过Gubbins检测重组区域并生成重组屏蔽比对,利用varcodons.py提取简约信息位点(PIS),最后通过IQ-TREE进行最大似然法系统发育树构建。针对海地2022年霍乱疫情的案例研究验证了流程实效,仅用1小时25分钟即完成41个菌株的全球系统发育定位。
研究结果方面,"系统发育就绪比对"部分显示,从4,196个菌株中提取出5,897个简约信息位点,时间跨度覆盖1961-2024年,为第七次大流行提供了全面的遗传变异图谱。"案例研究与结果解读"通过海地疫情重现性分析证实,2022年暴发菌株与2010-2019年当地流行株高度同源,验证了流程的溯源能力。
讨论部分指出,CholeraSeq虽专为霍乱弧菌O1设计,但通过更换参考基因组可适配其他细菌物种。与bacpage、Bactopia等现有工具相比,其优势在于支持多输入格式的混合处理和迭代更新功能。值得注意的是,基于参考基因组的分析方法虽避免了泛基因组研究的错配问题,但无法检测参考基因组外的插入序列或移动元件。
该研究的创新点在于首次提供了霍乱基因组监测的完整解决方案,通过标准化分析流程显著提升了数据可比性。预构建的全球菌株数据库和季度更新机制,使得疫情暴发时能够立即进行历史对比分析。流程设计的低计算资源需求特性,使其特别适合在中低收入国家推广应用,为全球霍乱防控提供了强有力的技术支撑。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号