-
生物通官微
陪你抓住生命科技
跳动的脉搏
Nature子刊:新型计算方法大大加速基因表达估算
【字体: 大 中 小 】 时间:2014年04月22日 来源:生物通
编辑推荐:
目前,卡耐基梅隆大学和马里兰大学的研究人员开发出一种新型计算方法,可大大加快来自于RNA测序(RNA-seq)数据的基因活性的估算。使用这种新方法(被称为Sailfish),以前需要花费很多时间的基因表达估算可在几分钟内即可完成,精准度等于或超过以前的方法。这种新方法被发表在2014年4月20日的《Nature Biotechnology》杂志。
生物通报道:随着基因表达分析对基础研究人员和医生变得越来越重要,目前,卡耐基梅隆大学和马里兰大学的研究人员开发出一种新型计算方法,可大大加快来自于RNA测序(RNA-seq)数据的基因活性的估算。
使用这种新方法(被称为Sailfish,得名于著名的快速鱼),以前需要花费很多时间的基因表达估算可在几分钟内即可完成,精准度等于或超过以前的方法。这种新方法被发表在2014年4月20日的《Nature Biotechnology》杂志。
目前存在庞大的RNA-seq数据,根据新的发现很可能进行再分析实验。CMU Lane计算生物学中心的副教授Carl Kingsford指出:“但是每次分析总计多达15个小时,特别是如果你想进行100个实验时,要花费大量的时间。利用Sailfish,我们可以使研究人员获得以前方法中得到的一切结果,但是速度更快。”
虽然一个生物体的遗传组成是静态的,但是随着时间的推移,单个基因的活性变化很大,使基因表达成为理解“生物体如何运转和疾病过程中发生了什么”的一个重要因素。基因活性不能够直接进行测量,但是可以通过监测RNA、携带基因产生蛋白质和其它细胞活性信息的分子进行推断。RNA-seq是产生这些基因表达快照的主要方法;在基因组医学中,据证明它对分析某些癌症特别有用。
RNA-seq过程产生许多的RNA短序列,称为“reads”。在以前的方法中,只有通过费力地将这些reads映射到它们在更大分子中的初始位置,才可以确定和测量RNA分子的来源。
但是Kingsford与Lane中心博士后Rob Patro、马里兰大学西北生物学和分子遗传学系副教授Stephen M. Mount发现,这个耗时的映射步骤可以被除去。相反,他们发现,他们可以将部分reads分配给不同类型的RNA分子,就像每个read作为一个分子或另外一个分子的“几个选票”。
没有映射步骤,Sailfish完成其RNA分析的速度比以前的方法快20到30倍。
Kingsford表示,对生物学家来说,这种数值方法可能不像一副地图那么直观,但是对于计算机科学家来说它具有完美的意义。此外,Sailfish方法更加强大——它能够更好地容忍reads中的错误或个体基因组间的差异。他解释说,这些错误可以阻止一些reads被映射,但是Sailfish方法能够利用所有的RNA read“选票”,这能提高方法的准确度。(生物通:王英)
延伸阅读:《Nature Biotechnology》:新型生物信息学工具使转录组形象化。
The Sailfish code has been released and is available for download at http://www.cs.cmu.edu/~ckingsf/software/sailfish/.
生物通推荐原文摘要:
Sailfish enables alignment-free isoform quantification from RNA-seq reads using lightweight algorithms.
Abstract: We introduce Sailfish, a computational method for quantifying the abundance of previously annotated RNA isoforms from RNA-seq data. Because Sailfish entirely avoids mapping reads, a time-consuming step in all current methods, it provides quantification estimates much faster than do existing approaches (typically 20 times faster) without loss of accuracy. By facilitating frequent reanalysis of data and reducing the need to optimize parameters, Sailfish exemplifies the potential of lightweight algorithms for efficiently processing sequencing reads.
知名企业招聘