基于长读测序无监督检测废水样本中新型 SARS-CoV-2 突变和谱系:HERCULES 方法的创新与应用

【字体: 时间:2025年02月10日 来源:BMC Genomics 3.5

编辑推荐:

  新冠疫情期间,病毒监测对公共卫生意义重大。为解决现有废水监测方法依赖数据库、难以检测新变种的问题,研究人员开展了 HERCULES(High-throughput Epidemiological Reconstruction and Clustering for Uncovering Lineages from Environmental SARS-CoV-2)方法研究。结果显示,该方法能有效识别和量化突变及谱系,且废水样本趋势比临床数据早一周发现,为疫情监测提供新工具。

  新冠疫情的爆发给全球健康带来了巨大冲击,让人们深刻认识到病毒监测在公共卫生领域的关键作用。在疫情高峰期,大量资源投入到 SARS-CoV-2 临床样本测序工作中,期望借此识别新变种、监测病毒进化。然而,随着疫情逐渐缓和,相关测序工作明显减少。与此同时,基于废水的流行病学(WBE)监测方法崭露头角,它能够通过检测废水中的 SARS-CoV-2 RNA,以较低成本快速获取社区层面的病毒流行信息,包括病原体存在情况、病毒载量和不同谱系的流行程度 。但现有 WBE 分析方法存在诸多不足,多数依赖从临床样本获取的序列数据库来分析 SARS-CoV-2 谱系,当测序工作减少,数据库不完整时,新变种可能长时间无法被检测到,而且这些方法难以处理复杂的病毒株混合样本,也无法有效识别共发生的突变。因此,开发一种更高效、不依赖数据库的方法迫在眉睫。
挪威公共卫生研究所(Norwegian Institute of Public Health)的研究人员 Ignacio Garcia、Rasmus K. Riis、Line V. Moen 等人开展了相关研究。他们开发了 HERCULES(High-throughput Epidemiological Reconstruction and Clustering for Uncovering Lineages from Environmental SARS-CoV-2)这一创新方法,并通过分析挪威 2022 年 7 月至 2023 年 10 月的废水样本进行验证。研究发现,HERCULES 能有效识别和量化 SARS-CoV-2 的突变及谱系,且废水样本中 SARS-CoV-2 的流行趋势比临床数据早一周出现。这一成果为疫情监测和公共卫生干预提供了有力支持,相关研究成果发表在《BMC Genomics》上。

研究人员在研究过程中运用了多种关键技术方法。首先是样本采集与处理,从挪威多个城市污水处理厂入口采集未经处理的废水样本,经过核酸提取和 RT-qPCR 检测后,将阳性样本核酸提取物混合保存 。其次是 PCR 扩增和文库制备,对特定的 1049bp 核苷酸片段进行 PCR 扩增,之后进行纯化和二次 PCR 用于纳米孔条形码标记 。最后是测序与生物信息分析,使用牛津纳米孔技术(ONT)对样本进行测序,然后运用 HERCULES 进行生物信息分析,包括数据归一化、序列格式转换等操作。

下面来看具体的研究结果:

  1. SARS-CoV-2 突变在废水和临床样本中的发生率相似:研究人员收集并测序了 214 个废水样本,利用 HERCULES 识别出 72 个 Spike 蛋白的氨基酸替换。通过与 GISAID 数据库中临床样本对比,发现多数突变已在临床样本中报道,但废水样本中还存在 32 个未在挪威临床样本中出现的 “隐秘” 突变。对比废水和临床样本中突变的流行率,发现二者相关性很强(Pearson 相关系数 0.77),且高流行率突变的相关性更高。同时,研究还发现不同突变的流行模式各异,但废水和临床样本中突变流行率的时间趋势有很强的重叠性。
  2. HERCULES 可用于识别 “低水平” SARS-CoV-2 谱系:HERCULES 识别出 487 个独特的突变谱系,其中只有 29 个流行率较高。通过与 GISAID 下载的临床样本数据对比,发现 8 个是废水特有的谱系。对一些隐秘突变谱系深入分析后发现,它们与某些临床谱系相似,虽然部分突变可能是测序误差,但也有一些可能是因为临床采样灵敏度低而未被检测到。这表明废水分析有助于发现隐秘突变和谱系,但对于与临床谱系仅有一个核苷酸差异的隐秘谱系,还需进一步高灵敏度分析来排除假阳性。
  3. 可从废水的部分 Spike 片段有效估计人群中 “高水平” SARS-CoV-2 谱系的流行率:HERCULES 通过内部数据库将突变谱系分类为 Pangolin 谱系,并进一步聚合成更高层级的谱系,如 TESSy 定义的谱系。研究发现,HERCULES 在对高发生率的 TESSy 谱系分类时表现良好,但对于一些未解决的 Pangolin 谱系(如 BA.X、BA.2.X 等)无法准确分类。通过开发的概率方法绘制 2D 图,研究人员对这些未解决谱系进行深入分析,发现部分谱系可能是样本污染或病毒进化过程中的特殊情况导致的。
  4. 高灵敏度搜索方法表明临床中观察到的突变趋势在废水样本中出现更早:HERCULES 配备 kmer 搜索方法,用于检测可能未被噪声检测算法追踪到的谱系定义突变。通过对废水和临床样本中核苷酸替换的追踪和对比,发现一些突变在废水样本中的流行率变化比临床样本更早。例如,5 个与 BA.2.86 谱系相关的突变在 2023 年 10 月后在废水样本中增加,而同期临床样本中频率较低。进一步分析还发现,将废水采样日期向前移动一周时,废水和临床样本中突变流行率的差异最小,这证实了废水监测能比临床监测提前一周检测到流行率变化的假设。

综上所述,HERCULES 是一种创新的无监督、不依赖数据库的 WBE 方法,它利用长读测序分析基因组小片段,在检测 SARS-CoV-2 突变和谱系方面具有显著优势。该方法无需更新数据库就能识别新谱系,理论检测限更低,测序成本和时间也大幅降低。研究表明,HERCULES 能可靠地识别突变和谱系,包括低频和隐秘变种,比传统临床监测能更早发现病毒变化趋势,为公共卫生监测提供了重要依据。然而,HERCULES 也存在一定局限性,如使用小基因组片段分类病毒谱系会导致不确定性,长读 ONT 测序的高错误率可能引入假阳性突变。但总体而言,监测废水是早期检测和监测 SARS-CoV-2 谱系的有效手段,HERCULES 有望部分替代临床样本测序,为全球病毒监测提供有力支持,尤其在临床测序工作减少的后疫情时代,其应用价值更加凸显。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号