-
生物通官微
陪你抓住生命科技
跳动的脉搏
八篇Nature文章:人类的后基因组时代
【字体: 大 中 小 】 时间:2012年09月07日 来源:生物通
编辑推荐:
在人类有史以来最伟大的认识自身的世纪工程——人类基因组计划完成后,我们进入到了人类的后基因组时代。在绝大多数人类基因序列已知的情况下,我们面临的新任务是如何将这些人类基因序列转变为人类认识自身的知识,以及如何对这些序列加以利用,从中寻找出可控开发的宝藏,使之能够造福人类的健康。
生物通报道 在人类有史以来最伟大的认识自身的世纪工程——人类基因组计划完成后,我们进入到了人类的后基因组时代。在绝大多数人类基因组序列已知的情况下,我们面临的新任务是如何将这些人类基因组序列转变为人类认识自身的知识,以及如何对这些序列加以利用,从中寻找出可控开发的宝藏,使之能够造福人类的健康。
试点项目改变了生物学家们对于基因组的看法。例如,研究人员发现即便只有小部分的DNA生成编码蛋白的信使RNA,大部分的基因组还是被转录成了非编码的RNA分子,其中一些现在已知是基因表达的重要调控因子。尽管许多的遗传学家认为功能性的元件是物种间最为保守的,他们事实上发现许多重要的调控序列却进化迅速。在国家人类基因组研究所(NHGRI)提出第二轮邀请,要求有意愿的参与者将他们的工作延展至整个全基因组后不久,该联盟在2007年发表了它的研究结果。而恰恰当新一代测序仪正进入腾飞时启动了这一“放大”阶段,使得数据采集更快更廉价。“我认为我们生成了我们原来计划生成的5倍的数据,却没有造成成本的任何变化,”华盛顿大学ENCODE组负责人John Stamatoyannopoulos说。
32个研究组,包括超过440位科学家,集中于24个标准类型的实验。他们分离并测序了从基因组转录的RNA,鉴别了大约120个转录因子的DNA结合位点。他们绘制了被甲基化学基团覆盖的基因组区域(这通常表明区域中的基因是沉默的)。他们检验了组蛋白的化学修饰模式(它帮助将DNA包装成染色体,并向基因表达增强或抑制的区域发送信号)。尽管在大多数人类细胞中基因组是相同的,然而利用的机制却是不同的。因此,研究小组在多种细胞类型(至少147种)中完成了这些实验,生成了1648个实验,ENCODE报告在本周的《Nature》杂志上。
例如Stamatoyannopoulos和他的合作者们采用一种称作DnaseI的酶在125种细胞类型中绘制了调控区域。该酶对于紧抱组蛋白的DNA作用极小,但它能剪切与诸如转录因子等其他调控蛋白质结合的DNA。测序剪切的DNA揭示了在不同的细胞类型中这些蛋白质的结合位点。研究小组总共发现了290万个这样的位点。大约有三分之一发现于一种细胞类型中,只有3700种存在于所有细胞类型中,表明基因组调控在细胞间存在较大的差异。
真正的趣事出现是在将各种数据集叠加到一起时。例如观测组蛋白修饰的实验揭示了对应DnaseI敏感位点边缘的模式。然后,研究人员添加了显示转录因子确切的结合位点和时间的数据。广阔的沙漠地区现在被几十万促成基因调控的特征所填充。并且每种细胞类型均采用这些特征不同的组合和排列生成了它独特的生物学。这种多样性有助于解释相对较少的蛋白质编码基因如何提供了人类生长和运转所需的生物负责性。ENCODE远远超过“各部分的总和,”麻省理工学院计算基因组学家Manolis Kellis说。
整个项目释放的数据正帮助研究人员们去了解疾病遗传学。2005年,一些全基因组关联研究(GWAS)生成了基因组上数千个似乎与疾病风险相关的单碱基差异或变异。但几乎90%的这些变异都在蛋白质编码基因之外,而研究人员对于它们有可能引起或影响疾病的机制所获得的线索却甚少。
ENCODE构建的图谱揭示许多这些疾病关联区域包括了增强子或其他的功能性序列。所有细胞类型都是重要的。Kellis的研究小组观察了一些与系统性红斑狼疮密切相关的变异,在这一疾病中免疫系统会攻击身体的自身组织。研究人员注意到在GWAS中鉴别的变异往往是在免疫细胞系中处于活性状态的基因组调控区域,但在其他类型的细胞中则不一定。Kellis的博士后Lucas Ward构建了一个称作HaploReg的门户网站,使研究人员能够通过系统的方式以ENCODE数据作对照筛查GWAS中鉴别的变异。“感谢ENCODE,我们现在能够解析更复杂的疾病,”Kellis说。
(生物通:何嫱)
生物通推荐原文检索:
1.Use of the Mercury Drop Electrode Method for Direct Evaluation of Minute Amounts of Lead in Urine .Nature 189, 57-58 doi:10.1038/189057a0
2.Finishing the euchromatic sequence of the human genome free .Nature 431, 931-945 doi:10.1038/nature03001
3.Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project .Nature 447, 799-816 doi:10.1038/nature05874
4.The accessible chromatin landscape of the human genome .Nature 489, 75-82 doi:10.1038/nature11232
5.An expansive human regulatory lexicon encoded in transcription factor footprints .Nature 489, 83-90 doi:10.1038/nature11212
6.Architecture of the human regulatory network derived from ENCODE data.Nature 489, 91-100 doi:10.1038/nature11245
7.Landscape of transcription in human cells .Nature 489, 101-108 doi:10.1038/nature11233
8.The long-range interaction landscape of gene promoters .Nature 489, 109-113 doi:10.1038/nature11279