派森诺生物



       细菌全基因组从头测序(Bacterial Whole Genome de novo Sequencing),是指对基因组序列未知或没有近缘物种基因组信息的某个物种,构建不同插入片段长度的基因组文库并进行序列测定,利用生物信息学方法进行组装、基因预测和功能注释,从而获得细菌的全基因组序列图谱。

关键词:细菌基因组;第二代高通量测序;第三代单分子测序;从头测序;进化;环境适应性

服务流程

测序策略

采用第三代单分子测序平台为主、第二代高通量测序平台为辅的测序策略获得细菌的全基因组序列图谱。

产品
文库插入片段大小(bp)
测序平台
测序模式
测序深度
框架图 400~500 Illumina MiSeq/HiSeq PE251/PE150 ≥ 100 ×
完成图 400~500 Illumina MiSeq/HiSeq PE251/PE150 ≥ 100 ×
20,000 PacBio RS II/Sequel Standard ≈ 100 ×

样品要求

产品
DNA
菌体
框架图 总量 ≥ 500 ng;浓度 ≥ 10 ng/μL 湿重 ≥ 1 g
完成图 总量 ≥ 20 μg;浓度 ≥ 100 ng/μL 湿重 ≥ 3 g

测序平台

Illumina MiSeq
PacBio RS II

PacBio Sequel

生物信息分析

提供 34 项基本分析内容;根据客户需求定制个性化分析方案

序号
分析项目
类别
分析
备注
1
数据整理
A
   
2
数据质控
A
   
3
高质量数据获取
A
   
4
基因组序列拼装与分析
A
   
5
蛋白编码基因预测
A
   
6
非编码 RNA 预测
A
   
7
其他非编码 RNA 预测
A
   
8
CRISPRs 预测
A
   
9
IS 序列预测
B
   
10
原噬菌体预测
B
   
11
基因岛预测
B
  完成图
12
致病菌毒力因子(VFDB)分析
B
   
13
抗生素抗性(CARD)分析
B
   
14
碳水化合物活性酶(CAZy)分析
B
   
15
信号肽预测
B
   
16
跨膜螺旋预测
B
   
17
蛋白编码基因的序列比对
A
   
18
蛋白编码基因的 GO 注释
A
   
19
蛋白编码基因的 eggNOG 注释
A
   
20
蛋白编码基因的 KEGG 注释
A
   
21
蛋白编码基因的 Swiss-Prot 注释
A
   
22
蛋白编码基因的 TrEMBL 注释
C
   
23
蛋白编码基因的 Pfam 注释
C
   
24
蛋白编码基因的 CDD 注释
C
   
25
蛋白编码基因的 InterProscan 注释
C
   
26
基因组圈图绘制
B
  完成图
27
基因组基本信息比较分析
C
  参考基因组数量 ≥ 1
28
泛基因组分析
C
  参考基因组数量 ≥ 10
29
基因家族分析
C
  参考基因组数量 ≥ 1
30
基于 16s rDNA 的系统发育树重构
C
  参考基因组数量 ≥ 2
31
基于单拷贝基因的系统发育树重构
C
  参考基因组数量 ≥ 2
32
基于 Mauve 的全基因组序列比对
C
  参考基因组数量 ≥ 1
33
基于 MUMmer 的全基因组序列比对
C
  参考基因组数量 ≥ 1
34
基因组数据上传
C
  提供相关数据
A: 框架图标准信息分析内容;
A+B: 精细图和完成图标准分析内容;
C: 高级信息分析内容。

结果展示
Pan-Core 基因稀释曲线
Venn图

基因圈图
进化树

项目交付

产品
交付方式
交付指标
项目周期
框架图 云盘交付 测序数据满足要求 25 工作日
完成图 云盘交付/硬盘交付 染色体 = 0 Gap
质 粒 = 0 Gap
40 工作日

研究思路

对于细菌基因组从头测序,文献中的热点研究主题包括:
  1. 微生物进化;
  2. 微生物的环境适应性;
  3. 微生物的分类鉴定等。
在选材方面有两种策略:
  1. 一个或数个个体的选材策略;
  2. 大样本群体的选材策略。
在研究策略和技术手段方面,选用基因组学和其它组学相结合的策略(转录组、蛋白质组和代谢组等):
  1. 基因组;
  2. 基因组与转录组相结合;
  3. 基因组与蛋白质组相结合;
  4. 基因组学、转录组与蛋白质组相结合等。
文章发表及杂志选择

杂志名称
SCI 收录
影响因子
分类
Journal of biotechnology
2.667
入门级
Standards in Genomic Sciences
1.594
入门级
Genome Announcement
入门级
Clinical Microbiology and Infection
4.575
进阶级
BMC Genomics
3.867
进阶级
Food microbiology
3.682
进阶级
Infection and Immunity
3.603
进阶级
FEBS Letters
3.519
进阶级
International journal of food microbiology
3.445
进阶级
PLOS ONE
3.057
进阶级
Journal of industrial microbiology & biotechnology
2.745
进阶级
Marine Genomics
1.883
进阶级
Nature genetics
31.616
升华级
Science
34.661
升华级
Genome research
11.351
升华级
Genome biology
11.313
升华级
Nucleic Acids Research
9.202
升华级
PLoS Pathogens
7.003
升华级
Clinical Infectious Diseases
8.736
升华级
MBIO
6.975
升华级
Environmental Microbiology
5.932
升华级
Scientific Reports
5.228
升华级

Q & A

细菌完成图仅用第三代单分子测序平台是否可行?
       不可行。小质粒(20 kb)的片段有可能在建库过程中丢失;染色体的部分区域也有可能会因为取样的概率问题或样品的降解问题而没有被测序到。

第三代单分子测序平台的单碱基准确率低,如何保证拼接结果的准确性?
      第三代单分子测序平台测序数据的单碱基准确率仅为 87~92%。通过三个步骤来确保拼接结果的准确性:在拼接前,利用第三代单分子测序序列间的 Overlap 对测序产生的数据进行校正;拼接后,利用第三代单分子测序序列对拼接的结果进行校正;第二步校正后,进一步利用高质量的第二代高通量测序数据对拼接结果进行校正。通过这三步校正,最终拼接结果的准确率可达到99.99% 以上。

项目周期如何计算?
       微生物基因组测序框架图的项目周期为 25 个工作日,完成图的项目周期为 40 个工作日。工作日一般从样品提取检测合格且预付款到账后开始计算。个性化分析内容的项目周期需要视具体情况而定。

如何保证 0 Gap
目前,采用二代和三代测序平台结合的方案,90% 以上的菌株能直接拼接得到完整的全基因组序列图谱。剩余的 10% 左右的菌株我们一般会利用一代测序平台来填补Gap。



上海派森诺生物科技股份有限公司
地址:上海市徐汇区银都路218号聚科生物园区2号楼
全国免费热线:4009-202-898

电话:021-64502808
网址:www.personalbio.cn       市场部:market@personalbio.cn

上海派森诺

本网页由上海派森诺生物科技股份有限公司委托 生物通 设计制作