编辑推荐:
为解决器官移植中 HLA 分型周转时间长及现有方法局限性问题,研究人员开展了利用牛津纳米孔(ONT)测序数据进行 HLA 等位基因分型的研究。结果显示,该算法在多基因分型上有较高一致性,优于 HLA - LA 且接近 Athlon2,为优化器官移植结果奠定基础。
在器官移植领域,免疫排斥是影响移植成功的关键因素。目前,人类白细胞抗原(HLA)分型对于提高移植器官的存活率至关重要,尤其是第三场分辨率(单核苷酸多态性水平,SNP level)的 HLA 匹配。然而,传统的血清学分型方法无法准确量化匹配程度,导致器官分配不合理和移植物存活率低。短读长测序虽然高通量,但存在测序时间长、比对模糊、覆盖度有缺口以及难以进行基因分型等问题。长读长测序技术如牛津纳米孔技术(ONT)虽能快速覆盖更大区域,但数据噪音大,需要生物信息学算法去噪处理才能用于 HLA 分型。现有 HLA 分型的生物信息学算法也存在局限性,部分算法仅对 I 类等位基因一致性较好,或需手动编辑才能获得准确结果,且许多开源工具维护困难,安装设置对非专业用户不友好。
为解决这些问题,Eurofins Viracor Clinical Diagnostics 的研究人员 Jalal Siddiqui 等人开展了一项研究。他们开发了一种基于比对和投票的算法,旨在利用 ONT 测序数据进行 HLA 分型,该研究成果发表在《BMC Genomics》上。
研究人员使用了两个批次的样本进行实验。第一批为开发批次,包含 31 个样本;第二批为测试批次,包含 63 个样本。实验过程中,首先提取 IPD - IMGT/HLA 数据库中 11 个 HLA 基因(HLA - A、HLA - B、HLA - C、HLA - DRB1、HLA - DRB3、HLA - DRB4、HLA - DRB5、HLA - DPA1、HLA - DPB1、HLA - DQA1 和 HLA - DQB1)的基因组序列,并构建等位基因分类表。然后,将 ONT 测序得到的 FASTQ 文件中的读段(reads)使用 BWA - MEM 或 Minimap2 比对到参考序列上,通过自定义 R 脚本统计每个基因在第三场分辨率下的等位基因比对数量,选取数量最多的两个等位基因作为基因型。同时,研究人员还将该算法与公开可用的 HLA - LA 和 Athlon2 管道进行比较。
研究结果如下:
- 比对和投票管道:通过 BWA - MEM 和 Minimap2 比对器及自定义 R 脚本,成功构建了从纳米孔读段确定基因型的工作流程。
- 重复分析:对于全长扩增子覆盖的基因,未发现重复序列;对于扩增子分裂的基因,合并序列后在第三场分辨率下无重复序列,表明实验所用的扩增子覆盖足以进行第三场分辨率的 HLA 分型。
- NanoStats 结果:开发批次和测试批次的读段质量通过 NanoStats 进行了评估,为后续分析提供了质量控制信息。
- 等位基因一致性:在开发批次中,使用 BWA - MEM 比对器时,总体等位基因一致性在第一场分辨率为 97.2%,第二场为 93.4%,第三场为 93.2%;Minimap2 比对器的相应一致性分别为 96.1%、90.8% 和 90.1%。在测试批次中,BWA - MEM 比对器的总体等位基因一致性在第一场分辨率为 97.5%,第二场为 92.1%,第三场为 89.8%;Minimap2 比对器的相应一致性分别为 96.0%、88.5% 和 86.4%。综合来看,BWA - MEM 比对器在两个批次中的总体一致性更高。
- 与其他工具比较:与 HLA - LA 和 Athlon2 管道相比,在开发批次中,BWA - MEM 投票算法在总体一致性上高于 HLA - LA,但低于 Athlon2;在测试批次中,BWA - MEM 投票算法的总体一致性同样高于 HLA - LA,低于 Athlon2。不过,在多个基因上,BWA - MEM 投票算法的一致性表现出统计学上的显著差异。
- 比较前两个等位基因的计数:通过研究开发批次和测试批次中样本的等位基因计数比,初步探索了纯合子和杂合子的判定标准。
研究结论和讨论部分指出,该算法在非 HLA - DRB 基因的第三场分辨率分型中表现出较高的一致性,在开发数据集和测试数据集中分别达到 > 96% 和 > 88%,且在第二场分辨率中 > 90%。虽然该算法在 HLA - DRB 基因的表现有待提高,但总体性能优于 HLA - LA 且接近 Athlon2。这一算法使用广泛可用的比对器,相对简单且计算处理时间短,为更好地利用纳米孔测序技术进行 HLA 分型、改善器官移植结果奠定了基础。未来,研究人员可通过优化算法,如过滤序列质量、考虑错配和加权比对分数等,进一步提高其性能。同时,探索其他长读长比对器或整合其他管道,也有望提升算法的整体表现。