PathoGD:开启 CRISPR 诊断引物和向导 RNA 设计的新征程

【字体: 时间:2025年01月31日 来源:Communications Biology 5.2

编辑推荐:

  在传染病诊断领域,CRISPR 技术潜力巨大,但引物和 gRNA 设计困难重重。为此,研究人员开展 PathoGD 相关研究。他们开发出自动化生物信息学流程,设计出高特异性引物和 gRNA,实验验证效果良好。这为传染病诊断提供新途径,助力防控工作。

  在传染病的防控战场上,快速且精准的诊断就像一把关键的钥匙,能有效阻止疾病的传播。传统的诊断方法,比如聚合酶链反应(PCR),就像被束缚在实验室里的 “巨人”,依赖专业人员和昂贵设备,难以广泛应用。近年来,CRISPR 技术异军突起,凭借其简单、特异性高、无需复杂设备的优势,在传染病诊断领域掀起了热潮。它就像一把精准的 “分子剪刀”,能准确识别病原体的核酸,被广泛用于检测各类病毒、细菌和寄生虫。
然而,CRISPR 诊断想要大显身手,还面临着一个关键挑战 —— 如何设计出高度敏感且特异性强的引物和向导 RNA(gRNA)。目前的设计过程复杂又繁琐,需要反复进行人工筛选、优化和重新设计,不仅耗时费力,还可能无法充分捕捉病原体的遗传多样性,导致诊断失误。而且,现有的 gRNA 设计工具大多是为基因组编辑 “量身定制” 的,并不完全适用于 CRISPR 诊断。因此,开发一款专门针对核酸检测、自动化且可扩展的引物和 gRNA 设计工具迫在眉睫。

为了解决这些难题,来自澳大利亚墨尔本大学(The University of Melbourne)等机构的研究人员踏上了探索之旅。他们开展了一项关于开发生物信息学流程 PathoGD 的研究,旨在实现基于 CRISPR - Cas12a 病原体检测的重组酶聚合酶扩增(RPA)引物和 gRNA 的高通量快速设计。经过不懈努力,他们成功开发出 PathoGD。这一成果意义重大,为传染病诊断的引物和 gRNA 设计提供了新的有力工具,有望推动传染病诊断技术的发展。相关研究成果发表在《Communications Biology》上。

研究人员在开展研究时,主要运用了以下几种关键技术方法:

  • 泛基因组分析:利用 Prokka 和 Roary 软件对目标基因组进行注释和泛基因组估计,找出保守基因作为潜在靶点,再通过一系列比对和筛选步骤设计引物和 gRNA。
  • k - mer 分析:借助 GenomeTester4 软件对目标和非目标基因组进行 k - mer 枚举和比较,去除可能存在交叉反应的序列,筛选出特异性 k - mer,进而设计引物和 gRNA。
  • 体外验证:通过 RPA - CRISPR - Cas12a 实验,对设计的引物和 gRNA 进行体外验证,检测其对目标病原体的检测能力和特异性。

下面让我们详细了解一下研究结果:

  • PathoGD 流程概述:PathoGD 是一款用 Bash 和 R 语言编写的自动化命令行工具,整合了多种生物信息学工具的功能。它包含泛基因组和 k - mer 两个模块,用户可根据偏好选择。运行时,用户输入模块和工作流程选择以及配置文件,就能自动完成引物和 gRNA 设计,输出结果包含多种信息,方便用户进一步筛选。
  • PathoGD 泛基因组和 k - mer 模块
    • 泛基因组模块:先找出目标基因组中高度保守(在 90% 以上目标基因组中存在)的蛋白质编码基因,与非目标基因组的蛋白质序列聚类,排除可能导致交叉反应的基因。然后在剩余基因中寻找规范的 TTTN PAM 位点,确定潜在 gRNA 序列,再通过序列比较去除与非目标基因组匹配的 gRNA,最后设计引物并进行虚拟 PCR 评估。
    • k - mer 模块:对目标和非目标基因组进行 k - mer 枚举,去除与非目标基因组有相似序列(允许最多两个错配)的 k - mer,再次枚举筛选出目标特异性且位于 PAM 位点下游、符合基因组流行度阈值的 k - mer 作为潜在 gRNA。同样去除可能形成发夹结构的 gRNA,设计引物并进行虚拟 PCR 评估。该模块还能识别基因组中的多拷贝序列,这些序列可作为潜在诊断靶点。

  • 最小化潜在脱靶活性:PathoGD 通过多步筛选,在序列层面减少脱靶可能性。比如在泛基因组模块中,排除与非目标物种相似的核心基因,通过 k - mer 比较去除与非目标或人类基因组数据库错配少于三个的候选 gRNA。同时,在输出结果中提供多种信息,帮助用户权衡引物和 gRNA 组合的敏感性和特异性,选择更可靠的组合。
  • PathoGD 对五种临床相关人类病原体引物和 gRNA 设计的计算性能:研究人员用 PathoGD 为五种全球重要病原体设计引物和 gRNA,涵盖革兰氏阴性菌和革兰氏阳性菌。设计过程使用了 NCBI 数据库中的基因组,运行时间因数据库大小而异,最长为 5 小时 26 分钟,大部分在 4 小时内完成。研究还找出了流程的瓶颈阶段,并通过使用高效算法工具提高了计算性能。
  • 使用 PathoGD 鉴定引物和 gRNA:PathoGD 鉴定出的目标特异性 gRNA 数量在不同物种间差异较大,与基因组大小、核心基因变异等因素有关。泛基因组和 k - mer 模块鉴定出的 gRNA 部分重叠,二者具有互补性。k - mer 模块还能识别多拷贝 gRNA,虽找到的保守引物结合位点有限,但在低病原体丰度样本检测中具有潜在优势。
  • PathoGD 与 PrimedSherlock 的比较:以黄病毒属的几种病毒为例,研究人员用 PathoGD 的 k - mer 模块设计引物和 gRNA,并与 PrimedSherlock 的结果对比。发现 PathoGD 设计的 gRNA 在目标基因组中的流行度和保守性相当或更高,且二者设计结果重叠较少,体现了不同设计方法的差异。
  • 引物和向导 RNA 的实验验证:研究人员对化脓性链球菌(S. pyogenes)和淋病奈瑟菌(N. gonorrhoeae)的引物和 gRNA 进行实验验证。结果表明,PathoGD 设计的引物和 gRNA 特异性高,能准确检测目标病原体,且在不同浓度下检测性能有差异。此外,针对淋病奈瑟菌多拷贝 gRNA 的研究发现,其虽信号积累慢,但特异性高,多拷贝 gRNA 组合可提高检测灵敏度。

研究结论和讨论部分指出,PathoGD 为 CRISPR - Cas12a 诊断应用提供了高通量、快速设计引物和 gRNA 的完整解决方案。它减少了对传统标记基因的依赖,利用两种互补方法探索基因组序列,为分子诊断向双靶点方法转变提供支持。同时,其可扩展性便于根据新测序基因组更新设计或评估已有设计。然而,PathoGD 也存在一些局限性,如 gRNA 设计局限于特定 PAM 位点、依赖准确的基因组数据库、未对设计进行评分等。未来可通过扩展对其他 Cas 核酸酶的支持、增加分类验证步骤、结合机器学习预测 gRNA 活性等方式改进。总体而言,PathoGD 在传染病诊断领域具有重要价值,为后续研究和诊断技术发展奠定了基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号