从韩国安城一个松树林土壤样本中分离出的Paenibacillus sp. M.A.Huq-81的基因组序列草图

《Microbiology Resource Announcements》:Draft genome sequence of Paenibacillus sp. M.A.Huq-81 isolated from the soil sample of a pine garden located in Anseong, South Korea

【字体: 时间:2025年12月17日 来源:Microbiology Resource Announcements 0.6

编辑推荐:

  韩国安城松树林土壤样本分离的Paenibacillus sp. M.A.Huq-81菌株完成基因组测序,组装为22条contig,总长5,210,425bp,GC含量48%,预测4,797个蛋白编码基因。

  

摘要

本研究报道了从韩国安城一个松树林土壤样本中分离出的细菌株Paenibacillus sp. M.A.Huq-81的基因组序列草图。该基因组由5,210,425个碱基对组成,这些碱基对被组装成22个contig,编码4,797个预测的蛋白质编码基因。

公告

Paenibacillus属最初由Ash等人(1)鉴定,属于Paenibacillaceae科。迄今为止,该属已包含323个有效发表的物种(2),这些物种来自多种环境,如土壤、根际、水、空气、食品、牛奶、人类血液和粪便(35)。在对该松树林土壤样本中的细菌多样性进行研究时,分离出了一个新的Paenibacillus属菌株,即Paenibacillus sp. M.A.Huq-81,本研究展示了其基因组序列草图。
菌株M.A.Huq-81是从韩国安城(37° 03′ 16″ N, 127° 30′ 59″ E)的一个松树林土壤样本中分离得到的。将1克土壤样本(采集日期:2021年2月10日)悬浮在9毫升无菌0.85%(重量/体积)NaCl溶液中,然后进行系列稀释至10?6浓度,将100微升稀释液涂布在Tryptic Soy Agar(TSA)平板上(6)。随后将平板置于28°C的培养箱中培养3天。通过多次划线接种在新的TSA平板上纯化单菌落(7)。该菌株已在中国普通微生物菌种保藏中心(CGMCC)注册,保藏编号为CGMCC 1.60092。基因组DNA是根据制造商的协议,使用Solg Genomic DNA Prep试剂盒(Solgent,韩国)从在TSB培养24小时的细菌培养物中提取的。使用AMPure XP磁珠对DNA片段进行大小筛选,以获得适合Illumina测序库的片段(通常长度为200–300个碱基对)。使用Nextera XT DNA Library Prep Kit(Illumina,美国圣地亚哥)制备测序文库。测序使用Illumina HiSeq 3000平台进行,采用双端2 × 150 bp的读取方式,遵循制造商提供的标准协议。使用Illumina的bcl2fastq软件版本2.20.0对原始读取数据进行去多重处理并转换为FASTQ格式。后续分析使用了HiSeq平台的原始双端读取数据。使用Trimmomatic版本0.38(8)对读取数据进行处理。基因组序列使用SOAPdenovo v2.04组装器(9)组装。基因组注释使用了NCBI Prokaryotic Genome Annotation Pipeline(PGAP)版本6.3(1012)。通过Type (Strain) Genome Server(https://tygs.dsmz.de)进行全基因组分类分析来确定菌株身份。使用基因组间距离(GGDH)生物信息学工具(13in silico计算DNA-DNA杂交(isDDH)值。与菌株M.A.Huq-81基因组最匹配的是模式菌株Paenibacillus pinistramenti ASL46(登录号GCA_005869875.1),其in silico DNA-DNA杂交值为22.4%。
基因组测序产生的读取总数为3,163,908条。Paenibacillus sp. M.A.Huq-81的基因组长度为5,210,425个碱基对,GC含量为48.0%。组装结果包含22个contig,覆盖率为79倍。共预测出4,913个基因,其中4,797个为蛋白质编码基因。基因组特征的详细信息见表1
表1
表1Paenibacillus sp. M.A.Huq-81的基因组特征
特征 结果
来源描述
位置 韩国安城
时间 2021年
类型 松树林土壤样本
测序总结
覆盖率 79倍
总碱基数 5,210,425
GC含量 48.0%
组装报告
contig数量 22
Contig L50 3
Contig N50 566.4 kb
基因组长度 5.2 Mb
注释报告
基因总数 4,913
CDS总数 4,822
含蛋白质的CDS数量 4,797
ncRNA数量 4
tRNA数量 80
质量分析
完整性 99.17%
污染率 0.3%

致谢

本研究未获得任何外部资助。
特别感谢中国科学院微生物研究所(WDCM)为菌株M.A.Huq-81的基因组测序提供的支持。
Md. Amdadul Huq:概念设计、初步分析、撰写;Jong-Whi Park:撰写、审稿和编辑;Md. Shahedur Rahman:撰写、审稿和编辑。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号