探寻亚马逊河中的 “污染侦探”:crAssphage 作为粪便污染标志物的研究意义

【字体: 时间:2025年04月27日 来源:Applied and Environmental Microbiology 3.9

编辑推荐:

  这篇研究聚焦亚马逊河,利用宏基因组测序与地理参考数据,评估了 crAssphage(一种拟杆菌噬菌体)的存在、多样性和丰度。研究发现其与人类粪便污染存在关联,为水质评估提供了新视角,对亚马逊河的环境保护及健康监测意义重大。

  

研究背景


亚马逊生物群落是地球上生态最为多样的生态系统之一,拥有庞大的河网,其河流向大西洋输送约全球 18% 的淡水。然而,人类活动不断向森林周边推进,城市中心与水体的距离日益拉近,加剧了污染物排放,可能导致病原体传播。

传统检测水质的方法主要是检测粪便指示细菌(FIB),如粪大肠菌群、大肠杆菌(Escherichia coli)、链球菌(Streptococcus)和肠球菌(Enterococcus)等。但 FIB 存在局限性,它既存在于人类粪便也存在于动物粪便中,难以确定污染来源,且与人类病毒病原体相关性差。此外,监测所有病毒病原体耗时耗力,成本高昂,因此急需一种通用且易于在微生物常规检测中应用的标志物。

病毒广泛分布于全球生态系统,数量庞大,其中噬菌体是感染古细菌和细菌的病毒,最为常见。crAssphage 是一类感染拟杆菌门细菌的噬菌体,自发现以来,因其在污水中丰度高、对人类粪便特异性强、与人类肠道病毒病原体相关性高且在人体肠道外复制率低等特点,被视为潜在的人类粪便污染生物标志物。本研究旨在利用宏基因组鸟枪法分析巴西帕拉州马拉巴市伊塔卡尤纳斯河(Itacaiúnas River)中 crAssphage 的丰度和多样性,并将结果与水质分析的理化参数、人口密度和森林砍伐数据进行比较,探究河流的人为影响程度与 crAssphage 丰度的关系。

材料与方法


  1. 采样区域:选择巴西马拉巴市作为研究区域,该市位于伊塔卡尤纳斯河流域,该流域面积达 42,000 平方公里,涵盖 10 个城市。伊塔卡尤纳斯河是流域内的主要水道,全长超 390 公里。在河流沿线四个不同地点(IT1、IT2、IT3、IT4)采集水样,每个地点采集三份,共 12 份水样。
  2. 样品采集与理化参数测量:使用经 10% 次氯酸盐和蒸馏水消毒的 Van - Dorn 瓶采集水样,随后转移至 5 升聚丙烯容器。利用 HANNA HI 9828 多参数仪器测量 pH、电导率(EC)、总溶解固体(TDS)和水中溶解氧含量四项理化指标。
  3. 样品预处理与 DNA 提取:水样先经 14μm 硝酸纤维素膜负压过滤去除大颗粒固体,再经 0.22μm 硝酸纤维素膜过滤保留生物材料。将含有生物成分的硝酸纤维素膜转移至含 DNA 保存液的 50mL 聚丙烯离心管中,于 - 80°C 保存。采用 DNeasy PowerSoil Pro Kit(QIAGEN)提取 DNA,使用 NanoDrop 1000 分光光度计评估 DNA 浓度和纯度,通过凝胶电泳评估完整性,选择浓度≥50ng/μL 且纯度指数在 1.4 - 2.0 范围内的样品进行后续测序分析。
  4. 地理参考分析:基于水文盆地概念和地理处理技术评估土地利用和土地覆盖的人为特征,依据 Cavalcante 等人的方法评估森林砍伐水平和人口密度。根据 Mapbiomas Brazil 项目 2020 年第 6 版分类计算砍伐面积,采样点的选择综合考虑人为影响梯度和采样便利性。
  5. 测序与生物信息学
    • 测序文库与质量控制:提取的 DNA 经 Illumina NovaSeq 6000 平台进行 2×150bp 双端文库测序。利用 FastQC 平台 v0.11.2 评估测序读长质量,使用 Fastp v0.22.0 去除低质量读长。
    • crAssphage 鉴定:将每个重复样品的读长合并组装,使用 Megahit v1.2.9 进行组装。将得到的重叠群(contigs)分别输入 VirSorter2 v2.2.4 和 DeepVirFinder v1.0 进行病毒序列预测,再用 CheckV v1.0.3 检查病毒基因组完整性。依据 Guo 等人的协议对 contigs 进行筛选,去除不符合条件的 contigs。利用 DRAMv pipeline v1.5.0 对 contigs 进行注释,再次过滤后,将筛选后的 contigs 输入 Integrated Phage HOst Prediction pipeline v1.3.3 进行宿主预测,输入 geNomad v1.11.0 进行分类学分配,提取属于 Crassvirales 目的 contigs 进行后续分析,并再次评估其完整性。
    • 统计分析:使用 Bowtie 2 v2.4.2 构建参考索引,将读长映射到 contigs 上,通过 SAMtools v1.12 获取映射数据。采用每百万转录本(TPM)方法对读长进行归一化处理计算 contigs 相对丰度,并进行 log (x + 1) 转换。利用 Vegan 包计算病毒 contigs 相对丰度的 α 和 β 多样性指数,使用 R 语言进行方差分析计算 α 多样性差异,通过 Bray - Curtis 距离和置换多元方差分析(PERMANOVA)检验 β 多样性差异,绘制聚类图。使用 seaborn Python 库绘制 Crassvirales 目 contigs 的聚类图,计算 crAssphage 相对丰度与环境参数的相关性,通过 Shapiro - Wilk 检验评估数据正态性,使用 Python SciPy 库计算 Spearman 相关系数。


结果与讨论


  1. 测序与分类学概述:在四个采样点(每个点三个重复)进行宏基因组测序,共获得约 4.093 亿条读长,平均每个重复 3410 万条。质量评估显示所有读长平均 Phred 质量分数为 35,且无接头污染。
  2. 病毒组成与多样性:采用基于 contig 的方法检索假定的病毒基因组,共提取到 18,210 个病毒 contigs,经 geNomad 分类为 20 个病毒家族和 3 个目。多数映射回病毒 contigs 的读长仅在 Caudoviricetes 目分类水平被鉴定,80.41% 和 1.3% 的读长未被分类。在家族水平上,伊塔卡尤纳斯河病毒组以蓝藻噬菌体为主,主要来自 Kyanoviridae 家族,占 log (TPM + 1) 转换读长的 70.38%。此外,还检测到其他多种病毒家族。geNomad 鉴定出 61 个属于 Crassvirales 目的噬菌体 contigs,占病毒组数据的 1.69%。

在病毒多样性方面,α 多样性指数(香农指数和丰富度指数)显示沿伊塔卡尤纳斯河病毒多样性显著增加,IT1 和 IT2 样本与 IT3 和 IT4 样本差异显著。这表明人类活动可能导致河口病毒生物积累,因为 IT3 和 IT4 点靠近马拉巴市人口最密集区域。β 多样性分析中,通过 Bray - Curtis 距离聚类和 PERMANOVA 检验发现,四个采样点存在显著差异,IT4 样本与其他样本差异尤为显著,这可能反映了不同程度的人为影响,IT4 采样点受人为影响最大,周边人口密度最高。
3. crAssphage 的存在与丰度:在所有采样点均检测到 crAssphage,其相对丰度从 IT1 到 IT2 略有增加,IT3 和 IT4 点逐渐升高。IT1 点可能的污染来源是周边森林砍伐严重(53.51%)的支流,虽人口密度不高,但森林砍伐可能暗示人类定居,且人类向森林扩张可能伴随着城市化程度低、卫生条件差的社区,导致粪便排放到水中。crAssphage 在所有采样点的存在有助于识别伊塔卡尤纳斯河现有粪便污染区域,对预防公共卫生问题具有重要意义。尤其是 IT1 和 IT2 采样点靠近娱乐区,crAssphage 的存在可能对人类健康构成风险,因为它与人类胃肠道病毒病原体密切相关。
4. crAssphage contig 分布:对 crAssphage contig 相对丰度进行聚类分析发现,IT1 和 IT2 样本与 IT3 和 IT4 样本明显分离,表明受人类影响较大和较小的环境中 crAssphage 谱存在差异。61 个 contigs 中有 2 个仅在 IT3 和 IT4 样本中出现,在 IT1 和 IT2 样本中完全缺失,这与之前研究中 crAss 样 contigs 仅在受人类影响的位点出现的结果相符,但本研究无法确定 IT1 和 IT2 点完全不受人类干扰。
5. crAssphage contig 的特征与宿主预测:CheckV 评估显示 61 个 crAss 样 contigs 完整性得分较低(<50% 完整)。DRAMv 软件注释分析发现 804 个基因,分为六类,其中假设病毒基因占比最多(73.38%)。还鉴定出 8 个在所有采样点都存在的 crAssphage 标记基因,包括 terminase large subunit 和 portal protein 等,这些基因可能是伊塔卡尤纳斯河 crAssphage 检测的候选标记基因,但需进一步研究其特异性。

宿主预测分析发现四个 crAssphage contig 的假定宿主,其中两个属于 Bacteroida 门,一个属于 Cyanobacteriota 门,一个属于 Archaea。crAssphage 与 Cyanobacteriota 和 Archaea 的关联此前未被报道,可能是由于 IPHOP 数据库限制,也可能是环境中 Crassvirales 噬菌体与古细菌和蓝细菌病毒存在遗传物质交换,干扰了宿主分类预测。此外,本研究仅获取了 crAssphage 片段,也限制了噬菌体宿主预测工具的准确性。
6. 环境因素对 crAssphage 分布的影响:伊塔卡尤纳斯河的理化参数均符合 CONAMA Resolution 357/2005 的规定,溶解氧(DO)、电导率(EC)和总溶解固体(TDS)相互之间存在显著相关性,且均与污染间接相关。但 crAssphage 相对丰度与理化参数未呈现强相关性,可能是因为理化参数变化有限,均在标准范围内,这表明仅依靠理化参数可能不足以确定河流中的人类污染情况。

在与人类密度的相关性方面,19 个 crAssphage contig 与人口呈正相关,证实了其作为人类粪便污染潜在标志物的作用。也有部分 contig 与人口密度无相关性,可能是因为一些 Crassvirales 噬菌体天然存在于环境中。此外,还有 5 个 contig 与人口密度呈负相关,可能与采样点(IT1 和 IT2)为娱乐区,周末人类活动频繁有关,说明即使在受人类影响较小的环境中,crAssphage 的存在也表明人类粪便污染沿河流传播。

从 19 个与人类相关的 crAssphage contig 中,鉴定出一组四个基因,包括 crAssphage portal protein、TerL protein、crAssphage DNA polymerase 和 hypothetical protein KNV36_gp052,这些基因可用于未来开发 qPCR 或数字 PCR 检测方法,快速、低成本地检测亚马逊淡水水体中的 crAssphage,但需进一步评估其分类学分辨率。
7. 研究局限性:本研究的主要局限性在于采样位置,仅在马拉巴市内采样,未涵盖河流更上游和下游区域,限制了分析范围。所有水样水质均符合 CONAMA 标准,难以将 crAssphage 与理化污染指标相关联。此外,未对伊塔卡尤纳斯河的病毒肠道病原体进行浓度测量,无法验证其与 crAssphage 的关系。而且,0.22μm 的过滤膜会使许多病毒通过,尽管考虑了中等大小颗粒中的病毒关联,但近期研究表明 crAssphage 可能与 0.45 - 0.2μm 粒径的颗粒显著相关,而该过滤膜无法完全捕获这些颗粒。

研究结论


本研究有助于了解 crAssphage 在全球水体中的分布情况,通过分子生物学和生物信息学方法,可将其作为准确检测人类对环境影响的标志物。研究在伊塔卡尤纳斯河鉴定出 61 个 crAssphage contig,表明河流中可能存在未被发现的粪便污染传播。相关性分析显示 19 个 crAssphage 与人类人口密度正相关,支持其作为粪便污染检测生物标志物的应用。这些数据为未来在亚马逊河粪便污染监测中使用 crAssphage 进行 qPCR 或数字 PCR 检测提供了重要信息,有助于淡水监测和处理决策。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号