HiFi测序,无限趋近宏基因组组成真相

【字体: 时间:2023年03月31日 来源:

编辑推荐:

  高精度长读长HiFi测序的使用和相关的装配程序可极大地提高组装质量,产生数百个环状基因组。此外,HiFi测序还可以覆盖所有高变区16S rRNA全长基因,对微生物进行更准确的分类。让我们一起来看看吧~

Background

食物浪费越来越受到人们关注,全球每年产生约14亿吨的食物垃圾,占城市固体废物总量的30-50%,食物垃圾的挥发性固体(85-95%)和水分(66-80%)含量很高,如果处理不当,会释放大量恶臭和渗滤液。另一方面,食物垃圾通常富含碳水化合物、蛋白质、脂类和矿物质,这使其成为生产可再生能源的潜在宝贵来源。同时,厌氧消化(Anaerobic digestion,AD)被认为是可再生能源生产和废物处理中最具成本效益和环保的技术之一,迄今为止已广泛用于处理食品垃圾。

厌氧消化由高度复杂的细菌和古生菌组成。基于测序的方式可以对微生物物种进行分类分析并组装。然而,由于短读长测序和组装技术的限制,会造成一定程度的遗漏,组装好的基因组往往会被分箱算法引入一些错误的contigs,这在一定程度上限制了它们的应用。高精度长读长HiFi测序的使用和相关的装配程序可极大地提高组装质量,产生数百个环状基因组。此外,HiFi测序还可以覆盖所有高变区16S rRNA全长基因,对微生物进行更准确的分类。让我们一起来看看吧~

2023年1月,发表于Frontiers in Microbiology的一篇题为“Recovery of metagenome-assembled microbial genomes from a full-scale biogas plant of food waste by pacific biosciences high-fidelity sequencing”的文章利用HiFi长读长测序构建了餐厨垃圾AD中微生物宏基因组,并与另外两个基于Illumina的大规模宏基因组数据进行比较评估HiFi测序的组装质量。此外,利用全长16S rRNA对微生物群落进行了研究。

1. 宏基因组组装结果及评估

测序共生成了64.6 Gb的PacBio HiFi reads, N50大小14.3 Kb, N90大小7.3 Kb(表1),平均碱基精度为99.94%。随后,研究人员用Hifiasm-meta将HiFi reads组装成contigs,生成的contig总长度为924.9 Mb,其中N50大小为87.7 Kb, N90大小为22.2 Kb(表1),比用Illumina短读长测序组装的contig要长得多(图2)。

表1. 测序reads和组装contigs的统计

image002.png

组装后的宏基因组包含292个环状contigs,长度大于1.0 Mb的圆形contigs平均完整性为97%。共生成非冗余微生物MAGs 60个,其中环状微生物MAGs 39个,非环状MAGs 21个(图1A)。在这60个MAGs中,46个MAGs只包含1个contigs, 6个MAGs包含2-5个contigs,只有5个MAGs包含>10个contigs(图1B),这比Illumina短读长测序组装的MAG要优越得多。根据CheckM的质量评估, 95%的圆形MAGs接近完整,然而,只有19%的非圆形MAGs接近完整(图1C),这主要是由于这些MAGs的完整性相对较低(图2A),非圆形MAGs的平均大小(2.65 Mb)小于圆形MAGs(2.97 Mb;图1D)。

image003.png

图1. 微生物基因组组装的统计与评价

在细菌和古生菌中,核糖体RNA (rRNA)操纵子通常编码16S、23S和5S rRNA基因,rRNA操纵子通常存在多个拷贝,在细菌中为1 - 15个,在古生菌中为1 - 4个。转运RNA (tRNA)基因在基因组中随机分布,通常有冗余拷贝。随着测序技术的进步,rRNA和tRNA基因的存在和完整性被认为是组装质量的额外指标。研究人员预测了60个非冗余MAGs中的rRNA和tRNA基因,发现所有基因组都至少有一个rRNA操纵子副本,54个MAGs有≥18种标准tRNA基因(图1 E,F),这表明大多数MAGs都是高质量组装。

为了评估利用HiFi测序进行宏基因组MAG组装的新颖性和优越性,研究人员选择了两项关于AD的大规模宏基因组研究进行比较。Campanaro等人(2020)从2014年至2019年发表的134个样本中收集了近0.9 Tb的Illumina序列数据,这些样本代表了广泛的不同沼气反应器系统,并构建了1401个MAG (BinSet1)。Ma等人(2021)使用了1.8 Tb的Illumina序列数据,这些数据来自56个以不同原料喂养的全尺寸沼气厂,并构建了2426个MAGs(BinSet2)。作者用全基因组平均核苷酸鉴定(average nucleotide identity,ANI)判断两种测序技术组装的基因组是否为同一物种。结果显示,HiFi测序组装的MAG中有37个匹配了BinSet1或BinSet2的MAG (ANI≥95%),其余23个MAGs在这两项研究中未发现(ANI < 95%),包括11个环状MAGs和12个非环状MAGs(图2A)。进一步分析已发表的与37个基因组匹配的MAG,发现HiFi测序组装基因组的平均contig数(5)远低于BinSet1(289)和BinSet2(166),而平均contig N50大小(2545 Kb)远高于BinSet1 (49 Kb)和BinSet2 (123 Kb)(图2 B, C)。此外,与匹配的MAG相比,HiFi测序组装的37个基因组的平均大小略大,平均CheckM污染值略低(图2 C,D)。因此可以得出,HiFi组装的微生物基因组明显优于短读长测序技术组装的MAG。

image004.png

图2. HiFi测序组装的微生物基因组与短读测序组装基因组的比较

2. 系统发育及相对丰度分析

所有基因组在界、门、纲、目、科分类学水平上均已成功分类,而在属和种水平分别有6个和17个基因组无法分类(图3B),表明这些基因组分别是属和种水平的新组装基因组。

image005.png

图3.组装的微生物基因组的系统发育

最丰富的基因组是环状基因组Cir48(分类注释为Defluviitoga tunisiensis),其最高覆盖深度为16,076 × ,远高于其他基因组(< 1,270 ×;图3 B)。Cir48和D. tunisiensis L3基因组的序列比对显示,这两个基因组存在明显的共线性关系(图3C)。此外,两个基因组的基因组大小(2.18 Mb vs. 2.05 Mb)和GC含量(31.2 Mb vs. 31.4%)相似,ANI值(97.8%)和16S rRNA基因同源性(100%)较高,表明这两个微生物属于同一种。它可以利用多种复杂的多糖,如纤维素、几丁质和木聚糖,发酵产生醋酸盐、二氧化碳和氢。由于这些化合物是产生甲烷的基本底物,因此可以合理地解释Cir48在目前的食物垃圾厌氧消化器中含量很高的原因。

然后,根据各基因组的分类注释和覆盖深度计算不同分类级的相对丰度,结果表明,在界水平上,微生物群落中细菌占93.9%,古生菌占6.1%。最主要的门是热孢菌门(70.5%),其次是广古菌门(6.1%)、拟杆菌门(4.7%)、互养菌门(4.1%)、脱硫菌门(3.5%)、放线菌门(3.1%)和厚壁菌门(2.4%)。16S rRNA全长基因与组装基因组衍生的细菌门的相对丰度相当(图4)。

image006.png

图4.食物垃圾厌氧消化器的微生物群落

3. 全长16S rRNA基因多样性分析

研究人员还使用从HiFi reads中鉴定的16S rRNA全长基因来研究微生物组成。他们从精确的HiFi长读数据中鉴定了54,135个16S rRNA基因。与之前的研究通过PCR扩增和PacBio HiFi测序获得16S rRNA基因全长序列不同,本研究直接从PacBio HiFi长reads中鉴定16S rRNA全长基因序列,无需任何PCR扩增。在已鉴定的16S rRNA基因中,大部分(67%)的长度在1500 ~ 1520 bp之间,长度峰值为1512 bp(图5A),与报道的微生物全长16S rRNA基因长度一致。此外,大多数鉴定的16S rRNA基因(80%)的平均碱基质量范围从Q20(99%)到Q40(99.99%;图5B),表明所鉴定的16S rRNA基因质量较高。

image007.png

图5. 基于从HiFi reads中鉴定的16S rRNA全长基因的微生物群落分析

16S rRNA全长基因识别出的分类单位明显更多,门、纲、目、科、属的数量分别是装配基因组识别的1.3倍、1.6倍、1.7倍、2.5倍和3.4倍(图5C),显示了利用16S rRNA全长基因研究微生物群落的优势。

Summary

本研究共构建了60个非冗余微生物基因组,其中包括39个环状基因组。所有基因组至少有一个rRNA操纵子副本,54个基因组有≥18种标准tRNA基因。值得注意的是,HiFi测序组装的MAG在连续性、完整性和污染指标方面比以前基于短读生成的MAG具有显著优势。除了生成质量明显提高的微生物基因组,HiFi测序还恢复了之前基于短读的研究所遗漏的新基因组,有助于加深对食物垃圾厌氧消化微生物组成的认识。

基于HiFi测序,不仅可以利用全长16S rRNA来对微生物进行分类,还可以基于宏基因组进行相对丰度分析及组装,全面满足在微生物基因组学方面的各类研究。

基因有限公司作为PacBio公司中国区代理商,自2011年以来将PacBio第三代单分子实时测序技术引入国内,一直为国内用户提供专业的三代测序系统的安装培训,技术支持,应用培训与售后维护工作,赢得客户的一致好评与信任。基因有限公司将一如既往的支持越来越多的PacBio用户。

image008.png

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号