-
生物通官微
陪你抓住生命科技
跳动的脉搏
计算机模型帮助你从“垃圾”中淘金
【字体: 大 中 小 】 时间:2006年02月16日 来源:生物通
编辑推荐:
生物通报道:随着测序生物越来越多,人们发现在高等生物基因组中有许多所谓的垃圾DNA。由于数目巨大,科学家一直相信垃圾DNA也起到重要作用,可是一直苦无研究方法。现在来自以色列的Compugen公司和Tel Aviv大学开发出一种创新的in-silico预测方法,并成功利用这一方法找到新的转录产物和蛋白,这些蛋白有用于治疗的潜在应用价值。这一科研成果发表在1月31日的《美国科学院院报》(PNAS)上。
已加工的假基因(Processed pseudogenes,PPGs)是那些通过对成熟mRNA进行反转录产生的cDNA序列,然后重新插入到一个基因组新位置产生的。这些cDNA序列通常不会再有蛋白产物。
来自以色列的研究人员利用这些假基因绘制了一副转录组图谱。通过对上千个人类假基因进行分析研究人员找到了上百个从未发现的转录产物。通过RT-PCR表明这些假基因仍然活跃在人类转录组中。另外,研究人员还可以利用这些假基因对那些曾经存在过的古DNA片段进行鉴定。研究结果表明基因组本身带有一个“虚拟的cDNA文库”,利用这个文库可以对现有的转录产物和已经消失的产物进行分析。
这种方法不仅可以用于人类基因组分析,还可以用于其它多细胞生物的基因组分析(生物通记者 谢菲)。
假基因知识导读
假基因(pseudogene)具有与功能基因相似的序列,但由于有许多突变以致失去了原有的功能,所以假基因是没有功能的基因,常用ψ表示。1977年在爪蟾的5S基因系统中发现了假基因,以后在珠蛋白基因簇、免疫球蛋白基因簇以及组织相容性抗原基因簇中都发现有假基因,而且通常是散布于有活性的功能基因之间。关于假基因的来源一般认为是由mRNA反转录成cDNA,然后整合在基因组中。假基因同cDNA一样没有内含子序列,也没有启动基因转录的启动子序列,而在5’端都有mRNA分子特有的多聚腺苷[poly(A)]序列。由于假基因没有生物学功能,所以不再受到进化的选择压力,因此在假基因中可以积累许多突变,并常常同时存在三种终止密码子序列。假基因是由功能基因演变而来,可以看作是进化的一种遗迹。但既然假基因是没有功能的,为什么仍然存在于基因组中呢?而且有证据表明,有的假基因还会重复形成,如山羊的类β--白基因的假基因g#x和gpz。这些都是有待深入研究的进化问题。
人 α—珠蛋白基因座的一个假基因ψαl,同三个有功能的α—珠蛋白基因在DNA序列上是相似的,只是假基因中含很多突变,如起始密码子ATG变成GTG;5’端的两个内含子也有突变,可能是破坏了RNA剪接;在编码区内也有许多点突变和缺失。DNA序列比较表明,ψαl,假基因同有功能的α2基因的序列相似性达73%。ψαl假基因被认为是由。—珠蛋白基因复制产生的。开始时,这个复制生成的基因是有功能的,后来在进化的某个时期产生了一个失活突变。由于该基因是复制生成的,所以尽管失去了功能,但是不致影响到生物体的存活。随后在假基因中又积累了更多的突变,从而形成了现今的假基因的序列。人的δ—珠蛋白基因编码两种β类珠蛋白中的一种,但其mRNA水平很低,编码生成的蛋白质也不是必不可少的,因为成年人还同时表达产生另一种β类珠蛋白,所以δ—珠蛋白基因被认为是介于功能基因同无功能假基因之间的一种中间物。
假基因是一种非自主的反转录转座元件。由于它来源于RNA聚合酶Ⅱ的转录产物,因此假基因必定是没有转录活性的。这是因为反转录产生假基因的RNA不包含位于转录起点上蝣的启动子序列。假基因通常具有mRNA的特征,所以称为已加工的假基因(processed pseudogene)。假基因不含内含子序列,末端有很短一段A·T碱基对,两端又各有一个短的正向重复序列,在染色体上的位置与其原先所在位置无关等,这些结构特征都说明了假基因的反转录转座起源假说。当然,目前对此也还存在不同的看法,主要是由于假基因本身并不编码反转录酶,也不产生转座酶等。因此,有人提出,假基因的出现可能是以反转录病毒为中介的转座过程,被转座序列的末端只是偶然地同转座子的末端相似而已。
原文链接:Genomic fossils as a snapshot of the human transcriptome,PNAS,vol. 103,no. 5: 1364-1369(2006)