新剪切模式揭示两千多种新蛋白

【字体: 时间:2014年02月10日 来源:生物通

编辑推荐:

  最近研究人员在一种新剪切模式的基础上,发现了两千多种新的哺乳动物蛋白。数据库中列有编码这些蛋白的核苷酸序列,只不过人们原先认为它们没有得到翻译。

  生物通报道:十多年前,人们就已经完成了对人类和小鼠基因组的测序,现在每个人都可以通过数据库使用这些信息。然而,人类和小鼠的蛋白质列表还未完成,最近研究人员还在一种新剪切模式的基础上,发现了两千多种新的哺乳动物蛋白。数据库中列有编码这些蛋白的核苷酸序列,只不过人们原先认为它们没有得到翻译。

“我们在研究蛋白时发现了一种奇怪的剪切模式,”文章的资深作者,澳大利亚国立大学的Aude Fahrer说。“于是我们就想看看还有多少类似的蛋白。”

他在研究参与染色体装配的Ncaph2蛋白时发现,其编码基因的一种剪切方式,使一个外显子缺少了17bp。这种剪切没有删除完整的密码子,应该会使阅读框发生位移,最终无法翻译成为蛋白。事实上数据库中的确列出了这样的选择性剪切,并将其注释为无法翻译。

然而Fahrer的研究团队发现,另有一个起始密码子和选择性剪切阅读框,令选择性剪切的蛋白得以翻译。研究人员指出,此前只报道过三例类似的蛋白异构体形成模式。

于是研究人员利用NCBIENSEMBL数据库,在小鼠和人类基因组中寻找类似的选择性剪切。他们发现有1849个人类转录本和733个小鼠转录本,以类似的方式编码选择性剪切形成的蛋白异构体。其中80%的转录本被错误地注释为不编码蛋白质。

“发现两千多种新蛋白令我们非常兴奋,”Fahrer说。“其中的一些很可能具有重要的生物学意义。”举例来说,其中一种蛋白异构体对一个通路的影响,与原始蛋白截然相反。

生物信息学分析只能得到预测性的结论。为了证明这些蛋白的确得以翻译,研究团队在蛋白预测信息的基础上分析了一个质谱数据库,验证了26种新异构体的存在。此外,他们还比对了新发表的翻译起始位点,验证了另外38蛋白异构体。

Fahrer的研究团队正在联系ENSEMBL数据库管理员,希望能够更新相关转录本的注释。“我们希望能使其他研究者们从中收益,”Fahrer说。

参考文献:

Wilson, L.O.W., Spriggs, A., Taylor, J.M., Fahrer, A.M. (2014). A novel splicing outcome reveals more than 2000 new mammalian protein isoforms. Bioinformatics 30 (2): 151-156

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号