东南大学最新文章:一种宏基因组测序片段分装方法

【字体: 时间:2013年10月11日 来源:生物通

编辑推荐:

  20世纪末宏基因组学的概念被首次提出, 从此打开了利用宏基因组学方法和技术研究微生物的大门。随着高通量测序技术的成熟, 宏基因组学已经成为了一门新兴的热门学科。来自东南大学生物电子学国家重点实验室的研究人员深入研究序列的关联性特征, 提出了一种基于关联性特征的分装方法,结合机器学习算法实现准确的分装, 在对不同物种层次和不同复杂度的模拟宏基因组测序数据集进行分装时都能保持良好的性能。

  

生物通“核心刊物”迎来了新期刊:科学通报,中国科学C辑:生命科学,这两份期刊均是由中国科学院和国家自然科学基金委员会共同主办的,我国学术期刊中的知名品牌,被国内外各主要检索系统收录,如国内的《中国科学论文与引文数据库》(CSTPCD)、《中国科学引文数据库》(CSCD)等;美国的SCI、CA、EI,英国的SA,日本的《科技文献速报》等。目前针对每期的重点内容,生物通将展开详细推荐,欢迎读者共同参与……

生物通报道:20世纪末宏基因组学的概念被首次提出, 从此打开了利用宏基因组学方法和技术研究微生物的大门。随着高通量测序技术的成熟, 宏基因组学已经成为了一门新兴的热门学科。来自东南大学生物电子学国家重点实验室的研究人员深入研究序列的关联性特征, 提出了一种基于关联性特征的分装方法,结合机器学习算法实现准确的分装, 在对不同物种层次和不同复杂度的模拟宏基因组测序数据集进行分装时都能保持良好的性能。

宏基因组学研究的首要目的就是对一个环境样本中所有的微生物物种进行区分, 并识别出它们各自在代谢中所起的作用。在传统单一培养微生物的方法中, 测序过程是针对的单一纯品克隆样本的, 所获得 DNA 片段也是来自于同一基因组。宏基因组测序的样本是多种微生物基因组的混合体, 其中包括几十甚至上千种微生物, 而且很多微生物都是未知的, 所以分析宏基因组测序数据时, 就需要引入一个特有的步骤称为分装, 即将宏基因组测序片段按照物种分类。

分装本质上是一种特殊的聚类方式, 指对宏基因组测序片段进行重叠区域保守拼接后根据一定的规则进行聚类. 聚类的物种层次精度不一样, 精确的可以聚类至种的级别, 而粗糙的只能聚类至界、门的级别. 聚类的精度取决于多个因素, 其中包括分装方法、群落结构和测序质量及深度. 微生物群落结构由研究样本所决定的, 测序质量和深度则依赖于测序技术和样本规模。

目前存在的分装方法主要分为3类: 第1类是基于序列相似性比对的分装方法; 第2类是基于物种分类标记物基因的分装方法; 第3类是基于序列特征的分装方法。但这些方法存在一些局限性,比如不是所有的宏基因组测序所得到的 DNA 序列中都包含标记物基因的; 其次近年来科学家也发现, 标记物基因也存在着种间平行转移的情况; 最后, 这种方法仍然太依赖于物种分类标记物基因数据库, 极大地限制了其应用范围。

在这篇文章中,研究人员深入研究序列的关联性特征, 提出了一种基于关联性特征的分装方法, 结合机器学习算法实现准确的分装, 在对不同物种层次和不同复杂度的模拟宏基因组测序数据集进行分装时都能保持良好的性能。通过对比, 发现此方法分装的正确率和稳定性都要优于目前国际上的无监督分装算法以及那些单纯使用三联、四联核苷酸出现频率进行分装的算法。

得益于高通量测序技术的日渐成熟, 宏基因组学在微生物群落的研究上进展迅速, 但是同时伴随着一个问题。如何将大量的 DNA 短片段快速正确地分开, 从而可以对宏基因组中的各种微生物进行研究, 包括发现新物种、鉴定新基因及其发现微生物群的新功能等。宏基因组分装技术就是解决这个问题的核心, 目前分装技术的主流是基于碱基使用偏向性特征的无监督算法。所以如何提取一种有效而又简单的序列特征参数是提升分装技术的重点。

这项研究提出了一种三联体核苷酸关联性特征参数, 它并不是单纯的使用三联体核苷酸使用频率, 它体现的是序列中每一个三联体核苷酸单碱基与碱基对之间的关联性的量化。

文章还指出,这一成果通过使用 K 均值聚类法和支持向量机对不同复杂度的模拟宏基因组数据集进行分装, 发现利用三联核苷酸关联性特征参数效果对大多数的数据集都可以进行合理地分装,但是这种特征值也存在不足,希望能在今后的研究中得以改进。

原文检索:

丁啸, 张倩倩, 曹唱唱, 等. 一种基于关联性特征的宏基因组测序片段分装方法. 科学通报, 2013, 58: 2854–2860
Ding X, Zhang Q Q, Cao C C, et al. A correlation feature-based method for binning metagenomic sequences (in Chinese). Chin Sci Bull (Chin Ver), 2013, 58: 2854–2860, doi: 10.1360/972012-993

 

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号