-
生物通官微
陪你抓住生命科技
跳动的脉搏
华人学者Nature子刊:人类转录组跨平台靶向分析
【字体: 大 中 小 】 时间:2015年01月22日 来源:生物通
编辑推荐:
来自普林斯顿大学等处的研究人员公布了一种新研发的针对转录组数据的搜索引擎,利用这一平台,研究人员可以分析多种不同的芯片和高通量测序数据,这将会带来多基因搜索数据分析的新浪潮。
这一研究成果公布在1月15日的Nature Methods杂志在线版上。
文章的通讯作者分别为普林斯顿大学的Moses Charikar,Kai Li,和Olga G Troyanskaya,其中李凯(Kai Li,音译)教授早年毕业于吉林大学,获得中国科技大学硕士学位,1986年赴美深造,现为普林斯顿大学正教授终身教职。
生物医学领域进入大数据时代,这一点毋庸置疑,目前整个生物组学的大数据就已经达到10的60次方的数量级,而人类现在只完成了10的21次方,如果没有大数据,我们将寸步难行。 延伸阅读:基因大数据将改变人类的未来
为此各国各大实验室都在积极备战,去年英国就投资3200万英镑资助首批5大项目,来提高医学生物信息学的能力、产能和核心基础设施。这项“医学生物信息学计划”预计总投资5000万英镑,将通过建立耦合复杂生物数据和健康记录的新方法,来解决关键的医学难题。
同时各种分析工具也应运而生,如这篇文章公布的SEEK跨平台搜索系统,这种系统能解决目前大规模人类表达数据的分析问题,能跨越多个表达平台,其中包括芯片,高通量测序技术,还有与用户单个,或多个基因有关的自动优化数据库。
SEEK能为生物医药研究人员提供一种系统水平上的,针对代表了整个异源人体不同途径通路,组织和疾病的无偏差分析,而且这一系统也利用一种新型交叉验证-加权算法,整合了成千上万个果蝇数据集,这样就能有效的识别相关的数据集,以及共调控基因。
这种跨平台分析搜索引擎目前包含有来自41种不同芯片和RNA测序平台的5210个数据集,这些数据来自155,025个实验。可以通过一种用户友好的交互式 web 接口接入:http://seek.princeton.edu/,其中包括表达可视化和解释模块。
SEEK搜索分析平台未来将能在生物医药等领域发挥越来越重要的作用,这种多基因搜索方式也将为基于元数据的搜索细化,以及基于可视化的分析铺垫道路。
(生物通:张迪)
原文摘要:
Targeted exploration and analysis of large cross-platform human transcriptomic compendia
We present SEEK (search-based exploration of expression compendia; http://seek.princeton.edu/), a query-based search engine for very large transcriptomic data collections, including thousands of human data sets from many different microarray and high-throughput sequencing platforms. SEEK uses a query-level cross-validation–based algorithm to automatically prioritize data sets relevant to the query and a robust search approach to identify genes, pathways and processes co-regulated with the query. SEEK provides multigene query searching with iterative metadata-based search refinement and extensive visualization-based analysis options.