TEAL-seq:解锁微生物群落基因表达奥秘的强大工具

【字体: 时间:2025年04月23日 来源:mSphere 3.7

编辑推荐:

  本文介绍了一种名为靶向表达分析测序(TEAL-seq)的新技术。它能克服宏转录组分析的局限,对特定物种进行基因表达分析。在皮肤微生物研究中效果显著,可助力深入了解微生物与宿主的关系,推动微生物群落功能研究发展。

  

引言


随着微生物组研究的发展,研究重点从微生物分布与疾病的关联,转向探究微生物影响宿主生理的机制。宏基因组鸟枪法测序(mWGS)虽强大,但无法揭示微生物的功能状态。宏转录组(metaTx)分析能了解微生物转录活性和基因表达情况,却受生物丰度、基因表达水平差异及宿主转录本干扰,难以定量低丰度微生物的基因表达,测序成本也较高。

皮肤微生物研究面临诸多挑战,其细菌种类丰度差异大,且宿主细胞核酸占比超 90%,常规 mWGS 和 metaTx 分析效率低。金黄色葡萄球菌(Staphylococcus aureus, Sa)和表皮葡萄球菌(S. epidermidis, Se)是皮肤微生物组的关键物种,对维持皮肤健康至关重要,但此前研究发现,皮肤拭子 metaTx 分析中微生物转录本占比不足 5% 。

靶向微生物分析可更高效、全面评估微生物组成和活性。基于阵列和捕获的策略虽有应用,但存在定制困难、成本高或操作繁琐等问题。本研究团队此前开发的 MA-GenTA(微生物基因组标签分析定量法)可有效进行物种水平的微生物分析,在此基础上,团队开发了靶向表达分析测序(TEAL-seq)技术,用于在 metaTx 不可行时进行低成本的 mRNA 分析。

结果


实验设计


选择SaSe作为研究对象,因其在皮肤微生物组中作用关键,且基因组和功能特征明确。采用两种靶向策略:单引物延伸(SPE)和分子倒位探针(MIP)法。SPE 利用 40 碱基引物与目标序列退火启动 DNA 合成;MIP 则是探针杂交、延伸、连接后扩增闭环。实验使用从纯培养物、混合培养物及对照样本中提取的 RNA 和基因组 DNA,评估技术重复性、对 RNA 输入量的敏感性、混合样本靶向特异性、rRNA 去除的影响、cDNA 预扩增的作用,并对比靶向 RNA 测序与标准批量 RNA 测序。

探针池实现高比例靶向和物种特异性序列捕获


针对SaSe设计了大量 SPE 和 MIP 探针,分别靶向各自的编码序列(CDS)。为应对微生物组低生物量问题,评估了单引物等温扩增(SPIA)技术,并测试 rRNA 去除对测序的影响。结果显示,SPE 和 MIP 在不同 RNA 输入浓度下,均有 94%-99% 的读数映射到目标区域,与批量 RNA 测序效率相当,且即使不进行 rRNA 去除,也未检测到 rRNA 读数。在单物种实验中,低至 1 ng 的 gDNA 输入量下,探针仍高度特异性结合目标基因组,在复杂背景核酸存在时,交叉杂交现象极少。

靶向转录组学方法具有良好的重复性


通过比较技术重复样本中每百万计数(CPM)推断的基因表达水平,评估 MIP 和 SPE 的重复性。结果表明,所有测序方法的技术重复样本相关性都很高。对于批量 RNA 测序和 MIP,有无 SPIA 处理的样本相关性良好,但 SPE 的相关性稍弱。使用 SPIA 时,MIP 和 SPE 中低输入量(1 ng)和标准输入量(10 ng)RNA 样本仍具有相关性,说明靶向转录组学在测量 mRNA 丰度方面前景良好。

探针性能在不同 CDS 间存在差异


SeSa的 gDNA 进行靶向测序,发现探针性能差异较大。Se探针的 CPM 范围比Sa探针更广,且基因组位置与 CPM 水平相关性不佳。对于 SPE 探针,平均 CPM 随探针熔解温度(TM)升高而显著增加,而 MIP 探针的 TM与 CPM 相关性极小。此外,SPE 探针错配会导致读数计数大幅下降,MIP 探针在多达三个错配时影响较小。基于这些结果,后续分析主要聚焦于 MIP 数据集。

核糖体 RNA 去除和等温扩增的影响


测试有无 rRNA 去除时 MIP 靶向的准确性,并与批量 RNA 测序对比。结果发现,MIP 靶向和批量 RNA 测序在 CDS 水平基因表达推断上相关性较弱(R2=0.31 - 0.63),部分原因是批量 RNA 测序必须进行 rRNA 去除。MIP 在有和无 rRNA 去除的 RNA 样本中,CDS 水平表达相关性为 R2=0.56 - 0.70,说明 rRNA 去除对非核糖体转录本测量影响较大。

评估 SPIA 对 mRNA 测量的影响时发现,批量 RNA 测序和 MIP 在有和无 SPIA 处理时相关性较高(平均 R2=0.83),且使用 SPIA 扩增后,CDS 水平的 CPM 值在批量和靶向 RNA 测序中变异性更小。SPIA 扩增引入的均方误差(SSE)显著低于 rRNA 去除,因此确定 MIP 结合 SPIA 为 TEAL-seq 的最佳工作流程。

TEAL-seq 能捕获不同生长条件下的基因表达变化


通过测量SaSe在不同 pH 值胰酪大豆胨肉汤(TSB)中的基因表达,模拟体内酸性应激,测试 TEAL-seq 捕获差异表达基因(DEGs)的能力。TEAL-seq 检测到的响应酸性应激的高倍数变化基因,与此前批量 RNA 测序研究中已知的酸响应基因一致,如SaSe的脲酶基因。尽管两项研究在实验条件和菌株上存在差异,但SaSe中上调和下调最显著的基因具有一致性,且样本聚类分析表明,TEAL-seq 表达模式受生长条件驱动,符合葡萄球菌酸响应的已知特征。

基因表达分析在模型和人体样本中的应用


为模拟皮肤微生物组样本低生物量的技术挑战,将 TEAL-seq 应用于重建人表皮(RHE)定植样本和人鼻拭子样本。结果显示,能轻松检测到SaSe的转录本,且这些样本的转录水平与 TSB 培养样本差异显著。RHE 和鼻拭子样本间的变异性高于 TSB 样本,可能源于个体差异或菌株遗传差异。此外,TEAL-seq 检测到部分与葡萄球菌定植相关基因的表达变化,但不同样本间存在差异,且部分基因表达变化出乎意料。这些初步数据表明,TEAL-seq 可用于研究体内相关通路的基因表达,比现有方法更灵敏。

讨论


TEAL-seq 是一种针对低生物量样本优化的靶向基因表达分析方法,即使存在复杂背景 RNA 或 DNA,也能获得高比例的靶向读数。测试的两种基于寡核苷酸的靶向方法中,MIP 比 SPE 更稳健,其推断的表达水平探针间变异更小。SPIA cDNA 扩增可减少重复样本间的变异,对推断表达水平的影响小于 rRNA 去除。

TEAL-seq 虽与批量 RNA 测序的绝对相关性较低,但在捕获复杂样本基因表达信息方面表现出色。基于实验室菌株基因组设计的探针,可捕获其他菌株和临床分离株的基因表达信息,这得益于短探针长度和多探针覆盖 CDS 的策略。

通过 TEAL-seq 进行的差异表达分析,能重现批量 RNA 测序观察到的生物信号,如SaSe对酸性应激的不同反应,这有助于解释二者侵袭性差异。宏转录组在低生物量微生物组研究中应用受限,而 TEAL-seq 在多种复杂样本中成功捕获可预测的表达谱,为研究群体水平的毒力途径和免疫原性代谢物表达提供了新方法,有助于深入理解微生物组功能和个体物种的作用。未来需更多研究进一步验证 TEAL-seq 在复杂自然微生物群落研究中的潜力,但目前结果已显示其在皮肤微生物研究中的应用前景。

材料和方法


细菌样本及 RNA 和 DNA 提取


培养Staphylococcus aureus USA300 和Staphylococcus epidermidis Tü3298,分别在不同条件下培养后提取 RNA 和 DNA。RNA 提取时加入 RNAprotect Bacteria Reagent 保护 RNA,通过离心、匀浆等步骤提取;DNA 提取则通过离心收集细胞后,使用 GenElute Bacterial Genomic DNA Kit 提取。同时制备混合培养物、小鼠微生物组 DNA 和鼻拭子 RNA 样本。

重建人表皮细胞培养


按照特定方法培养重建人表皮(RHE)组织,接种细菌后孵育,再用 PBS 冲洗,加入含 β- 巯基乙醇的 RLT 缓冲液保存 RNA,冻存后待提取。

靶基因选择和探针设计


基于SaSe的泛基因组数据集,选择特定保守 CDS 进行探针设计。使用 Tecan Genomics 和 Molecular Loop 分别设计 SPE 和 MIP 探针,经过多轮筛选,去除与其他物种或人类转录组匹配度高的探针,合成并混合所有靶向探针。

批量 RNA 测序文库制备和测序


使用 NEBNext Ultra II Directional Library Prep protocol 和 NEB 的细菌 rRNA depletion kit 制备批量 RNA 测序文库,部分样本结合 SPIA 预扩增。文库构建完成后进行质量评估、归一化,最后在 NovaSeq 6000 SP flowcell 上测序。

cDNA 合成和 SPIA 扩增


利用 Crescendo cDNA synthesis for qPCR protocol 进行第一链和第二链 cDNA 合成,部分样本进行 SPIA 扩增,之后纯化并定量 cDNA。

靶向 RNA 测序文库制备和测序(使用单引物延伸探针)


SPIA 扩增的 cDNA 样本稀释后,按 Allegro Targeted Genotyping V2 protocol 与定制探针池进行靶向 RNA 测序文库制备,非扩增 cDNA 样本则直接使用。样本经酶切、连接条形码接头、杂交、延伸等步骤,最后在 NovaSeq 6000 SP flowcell 上测序。

靶向 RNA 测序文库制备和测序(使用分子倒位探针)


使用 Low Input DNA Target Capture kit 和 Crescendo kit 生成的 cDNA 样本制备靶向 RNA 文库,样本无需归一化。杂交后 PCR 扩增,文库混合纯化后在 NovaSeq 6000 SP flowcell 上测序。

Illumina DNA Prep 文库


使用 Illumina DNA Prep, Tagmentation kit 和 IDT for Illumina DNA/RNA UD Indexes 制备SeSa gDNA 文库,组装后与参考基因组对比确认样本准确性。

基因组序列比对


使用 Trimmomatic、Cutadapt 或 seqtk 处理测序读数,去除低质量和接头序列。使用 BWA-MEM 将读数比对到参考基因组,经过筛选、排序等处理,计算每个 CDS 区域的读数计数,并进行标准化。

探针序列比对


使用 BWA-MEM 将 SPE 和 MIP 读数比对到探针序列数据库,提取特定位置的探针序列并生成新的 fasta 文件进行比对。比对结果经过筛选、转换格式后,使用 bedtools 计算原始计数并进行 CPM 标准化。

差异表达分析和相关性分析


在 R 环境中使用 DESeq2 进行差异表达分析,设定差异表达基因标准为倍数变化幅度 > 4 且调整后 P 值 < 0.01。使用 stats 包计算相关矩阵,用 ggpubr 评估两两相关性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号