-
生物通官微
陪你抓住生命科技
跳动的脉搏
走向云端的高通量测序
【字体: 大 中 小 】 时间:2014年08月08日 来源:生物通
编辑推荐:
尽管你可能对它还不熟悉,但云计算可以很好的为中小型实验室服务,为他们解决高通量测序的数据分析难题。为此,Nathan Blow博士在Biotechniques上撰文对这一技术进行了详细的介绍。
生物通报道:随着测序通量持续攀升和测序成本直线下降,测序所产出的数据也出现了激增。这样的海量数据不仅为人们带来了前所未有的机遇,还在数据储存、数据传输和数据分析方面提出了新的挑战。
以往研究者们需要建立计算机集群来储存和分析大数据集,同时运行几十台甚至几百台计算机。然而许多人都没有这样的条件,因此越来越多的研究者们选择通过“云计算”来解决问题。
尽管你可能对它还不熟悉,但云计算可以很好的为中小型实验室服务,为他们解决高通量测序的数据分析难题。为此,Nathan Blow博士在Biotechniques上撰文对这一技术进行了详细的介绍。
走向云端
2010年,多伦多大学的分子遗传学教授Lincoln Stein在Genome Biology杂志上发表文章,首次提出将基因组信息移到“云端”。Stein领导着国际癌症基因组联盟(ICGC)的数据协调中心,该中心的任务是确保所有研究者都能使用ICGC的数据集。据Stein介绍,这些数据现在已经达到了1 PB(petabyte,相当于GB的百万倍),而且在2018年将会接近10 PB。“早在2010年我就清楚,储存和分享基因组数据的传统方式将无法适应时代的发展,”Stein回忆道。
他当时担心,到2014年只有少数高配置的计算生物学团队,才能使用ICGC的完全数据集进行分析。而越来越快的测序数据产出,将最终让人无法在本地服务器上进行必要的数据储存。
Stein提出的解决方法很直接:将商业化的云计算服务器利用起来,长时间租用其硬件和储存空间。云供应商为用户提供了建立“虚拟主机”的能力,利用极大的服务器和节点集群,实现基因组分析所需的PB级存储空间。(延伸阅读:二代测序,新年新总结)
Stein写这篇文章的时候,测序系统平均每次所生成的数据还算是比较少的。自那以后,测序的数据产出又有了显著的提高,而且随着测序成本的下降,这一技术的使用也越来越广泛。那么数据分析和储存方式有没有迎头赶上呢?又有多少数据储存和分析已经进入了云端呢?
云中的主机
初次使用云计算有点像是在选购台式电脑,你得根据自己的需要,确定自己“虚拟主机”的配置。比如需要多少内存?速度要多快?储存容量要多少?对于许多实验室来说,购置大型计算机基础设施既昂贵又费时,这时云计算就成为了一个很有吸引力的选择。
今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号