编辑推荐:
为解决 HAV 全基因组测序困难及分子流行病学研究不足的问题,阿根廷研究人员开展 HAV 全基因组测序策略研究。结果显示该策略高效,且 WGS 分析更可靠。推荐阅读,助您了解甲肝研究新进展,把握病毒研究前沿方向。
甲肝病毒全基因组测序研究解读
在医学的微观世界里,甲肝病毒(HAV)一直是科学家们密切关注的对象。甲肝(HA)是由 HAV 引起的肝脏急性炎症,这种病毒属于小核糖核酸病毒科肝病毒属,主要通过粪口途径传播,比如被污染的食物和水,还有人与人之间的接触。HAV 的基因组是单链 RNA,长度约 7.5kb,包含 5’和 3’非编码区、一个开放阅读框(ORF)以及一个聚腺苷酸尾。而且,HAV 还存在多种基因型,目前已知有 7 种基因型(I - VII),其中 I 到 III 型和 VII 型会感染人类,并且还有 7 种亚型(IA、IB、IC、IIA、IIB、IIIA 和 IIIB)。
随着全球卫生条件的改善和疫苗的广泛使用,甲肝的流行病学特征发生了显著变化。过去,甲肝多为儿童期的地方性流行病,现在却常常引发影响年轻成年人的散发性疫情。近年来,还出现了一些由甲肝病毒引起的食源性疫情,以及在未接种疫苗的弱势群体(如无家可归者、注射吸毒者和男男性行为者(MSM))中爆发和持续传播的情况。这些变化使得甲肝感染相关的住院率和死亡率有所上升,甲肝也成为了全球公共卫生领域的一个重要关注点。
在甲肝的研究中,分子流行病学起着关键作用。它能帮助科学家追踪病毒来源、了解病毒传播途径、监测疫情爆发,还能研究不同地区病毒株的引入和基因型的变化。以往,对 HAV 的系统发育和基因分型分析通常基于部分基因组序列,比如 VP1/P2A 连接区、VP1/P2B 连接区等。虽然分析这些亚基因组区域在疫情调查和监测中发挥了一定作用,但随着研究的深入,科学家发现,要更准确地识别 HAV 菌株,进行分子监测,全基因组序列(WGS)分析才是更可靠的方法。因为 WGS 不仅能提供更详细的病毒进化信息,还能帮助发现点突变、突变组合以及重组事件。
然而,获取 HAV 的全基因组序列并不容易。传统的桑格测序技术既费力又耗时,无法满足快速研究的需求。尽管下一代测序(NGS)技术已经出现,并且在新冠疫情期间,被广泛用于研究 SARS-CoV-2 变异株,发挥了重要作用。但到目前为止,利用 NGS 技术快速高效地生成 HAV 全基因组序列用于基因分型和分子流行病学追踪的方案却很少。
在阿根廷,自 2005 年实施甲肝疫苗接种计划后,甲肝的发病率大幅下降,从高流行地区转变为低流行地区。但近年来,情况又有了新变化,20 - 39 岁的年轻人中出现了较多临床病例,而且在 2017 - 2018 年,包括阿根廷中部在内的多个地区,都出现了甲肝疫情,主要影响未接种疫苗的年轻成年男性,尤其是 MSM 群体。面对这些情况,当地的研究人员意识到,分析 HAV 完整病毒基因组对于识别可能与毒力、传播性和疫苗逃逸变化相关的基因变异至关重要,这有助于更好地了解疫情爆发、病毒进化和流行病学监测的关键方面,从而做出更科学的公共卫生决策。可是,当时阿根廷的本地序列数据非常稀缺,全球已发表的使用 NGS 技术的 HAV 全基因组测序方案也不多。
为了解决这些问题,来自阿根廷相关研究机构的研究人员,在《Scientific Reports》期刊上发表了题为 “Development of an amplicon - based next - generation sequencing strategy for hepatitis A virus whole - genome sequencing” 的论文。他们通过研究得出结论:开发的基于扩增子的 NGS 全基因组测序工具,能够高效地从阿根廷的样本中生成新的完整和近乎完整的病毒序列;全基因组测序在系统发育分析方面比部分 VP1/2A 区域测序更准确可靠,但在无法进行全基因组测序时,研究 VP1/2A 区域的较大片段也可作为疫情调查的有用替代方法。这一研究成果对于深入了解甲肝病毒在阿根廷乃至全球的传播和进化,以及制定更有效的防控策略具有重要意义。
在这项研究中,研究人员用到了几个主要关键的技术方法。首先是核酸提取,从样本中提取出 HAV 的核酸。接着设计了 25 对引物,利用引物对样本进行富集,这些引物能扩增出大约 400bp 的部分基因组片段,覆盖整个 HAV 基因组序列。之后使用 Illumina COVIDSeq Test 构建 DNA 文库,并在 MiSeq 设备上进行测序。对测序数据,用 FastQC 和 Trim Galore 进行质量控制和引物修剪,再用 BWA、SAMtools 和 iVar 等工具将数据与参考基因组比对并生成一致性序列。最后,利用最大似然法,使用 IQ - TREE 软件进行系统发育分析,还通过其他工具如 MEGA 和 BEAST 进行对比验证。
下面来看看具体的研究结果:
- 样本扩增和测序结果:研究人员选取了 16 个之前通过 RT - 实时 PCR 检测为 HAV 阳性的血浆和粪便样本。经过 PCR 富集和 NGS 测序后,11 个样本成功扩增并测序,这些样本在实时 RT - PCR 中的 Ct 值均≤33.2。NGS 测序平均每个样本产生 1,509,242 条读数,整个 HAV 基因组的覆盖深度在 21,040X 到 50,314X 之间(中位数为 41,676X)。9 个样本的水平覆盖度达到整个基因组的 90 - 100%,不过有 2 个样本覆盖度较低,分别为 85.6%(样本 MF4)和 79.3%(样本 S3)。
- 填补序列间隙:对于 6 个样本,由于部分区域覆盖深度小于 10X,出现了序列间隙。研究人员用特定引物进行常规 RT - PCR,然后通过桑格测序来填补这些间隙。但遗憾的是,4 个样本因原始材料不足,无法进行该检测,最终只对 2 个样本进行了操作。
- 系统发育分析结果:研究人员分析了 11 个 HAV 全基因组和近全基因组序列,以及每个 HAV 基因型和亚型的参考序列。构建了 3 种不同的系统发育树,分别基于全基因组序列、1084bp 的 VP1/2A 部分序列和 415bp(文中实际分析的是 422bp)的 VP1/2A 部分序列。结果显示,全基因组序列分析确认所有样本都属于 IA 基因型。样本 S2 与之前阿根廷的 HAV 全基因组序列密切相关,和 MF3、S1 - 16 聚在同一组。其他序列则对应 2017 - 2018 年 MSM 疫情及随后几年分离的样本,聚在一起。部分序列(422bp 和 1084bp)分析虽然能得到与全基因组序列一致的基因型分类结果,但支持值较低,尤其是 422bp 序列分析时,在菌株间系统发育关系的分组和进化支的支持度上,与全基因组序列分析有明显差异。通过树拓扑测试发现,部分序列树的似然值明显低于全基因组序列树。另外,用其他系统发育工具(邻接法和贝叶斯分析)进行分析,也证实了基因型、亚型和阿根廷菌株的分组情况。
研究人员在讨论部分指出,全球范围内,随着社会卫生条件的改善和疫苗接种的普及,甲肝的流行病学情况发生了很大变化。分子流行病学虽然对了解甲肝有很大帮助,但目前分子特征分析并不普遍,而且常局限于部分小基因组片段的扩增。全基因组测序虽对疫情研究更有优势,但传统方法获取全基因组序列困难。他们开发的基于 Illumina 技术的 HAV 全基因组测序方案,利用了新冠病毒测序试剂盒(COVIDSeq test),成功从阿根廷的临床样本中获取了 11 个全基因组或近全基因组序列,为阿根廷的甲肝研究提供了重要数据。
与之前的研究相比,该方案有一定优势,比如使用的试剂盒在病毒监测实验室中较为常见,便于获取 HAV 序列,而且在优化过程中,能对 Ct 值高达 33.2 的样本进行扩增和测序,性能比一些之前的技术更好。不过,该方案也存在一些问题,如多重反应中部分基因组区域无法正确扩增,导致基因组不完整,虽然可以用桑格测序填补间隙,但仍存在挑战。
总体而言,这项研究开发的基于扩增子的 NGS 全基因组测序工具,利用了现有的基础设施、试剂和设备,为阿根廷甲肝病毒的分子流行病学研究提供了重要信息。这一技术不仅有助于深入了解当地甲肝病毒的传播和进化情况,还能为公共卫生监测提供有力支持,帮助相关部门及时发现疫情并采取针对性措施,甚至还可能用于研究环境样本中的甲肝病毒,为防控甲肝疫情开辟新的思路和方法。