-
生物通官微
陪你抓住生命科技
跳动的脉搏
类似Google的蛋白功能搜索引擎研究进展
【字体: 大 中 小 】 时间:2007年07月23日 来源:生物通
编辑推荐:
细胞通过成千上万控制其生长和分化的蛋白相互协作而发挥功能,关键蛋白功能失常常会导致疾病。目前已经有许多关于探索所有人类蛋白功能的大规模研究项目。最近,de Recherches Cliniques de Montréal (IRCM)研究所Benoit Coulombe博士率领的研究小组新发展了一套行之有效的蛋白组学方法,有助于加深人们对人类蛋白组学的了解和进一步研究蛋白的功能。详细内容刊登于7月20日《Molecular Cell》杂志。
生物通报道:细胞通过成千上万控制其生长和分化的蛋白相互协作而发挥功能,关键蛋白功能失常常会导致疾病。目前已经有许多关于探索所有人类蛋白功能的大规模研究项目。最近,de Recherches Cliniques de Montréal (IRCM)研究所Benoit Coulombe博士率领的研究小组新发展了一套行之有效的蛋白组学方法,有助于加深人们对人类蛋白组学的了解和进一步研究蛋白的功能。详细内容刊登于7月20日《Molecular Cell》杂志。
蛋白很少单独行动,更多情况下是与其它蛋白聚合为复合体,协作发挥功能。Coulombe等推测相互作用的蛋白可能是在同一生物学途径中的搭档,因此保留了相同的(或相关的)功能。于是,他们发展出一种利用蛋白组学方法和他们研制的运算法则,通过功能已知的蛋白,研究与之相互作用的蛋白伴侣的功能的“公式”。
Coulombe等通过系统性分析已知在基因转录和RNA加工过程中发挥特定功能的32个人类蛋白的搭档,绘制出一个包括436个蛋白和由这些蛋白形成的805个反应在内的复杂网络。为了证明物理学上相互作用的蛋白,功能上也有相关性,Coulombe等特意从网络中选择了一组功能未知的蛋白,根据其网络背景对其功能进行详尽研究。
Coulombe等得到了一个被期待已久的发现:一种调节小RNA分子稳定性的关键酶。科研人员早在十几年前便意识到了这种酶的存在及其重要性,但苦于缺少有效的提取方法而不能对其进行深入研究。Coulombe等发现这种酶是另一种受其调节的蛋白的搭档,并将其命名为MePCE。除了MePCE,Coulombe等还发现了许多其它重要蛋白及这些蛋白在细胞中的功能。
Human Proteotheque Initiative (HuPI)是Coulombe实验室的一个卓有远见的项目,最终目的是目标是绘制一张与调节细胞生长、分化及疾病进行有关的蛋白的相互作用图谱。HuPI的中心是其实验性平台,术语为“HuPI discovery engine”。《Molecular Cell》文章所描述的是第一代技术平台。
现在最为重要的是发展一种高度可信的、有效的探索途径,得到尽可能全面、精确的相互作用图谱。Coulombe博士将其HuPI探索引擎比作Google搜索引擎。建立一套产生无用信息的方法无啻于浪费时间和资源,Coulombe的目标是集中精力建立一个只产生相关、有效信息的蛋白组学途径。(如同Google为网络搜提供有效连接图谱,省去更多不必要的信息)。虽然已经取得了一定成就,但Coulombe的最终目标是建立一个代表人类细胞正常生理学状态和特定疾病状态下的分子图谱的公用指令系统(repertoire),他希望这种蛋白相互作用网络的全面指令特征——Human Proteotheque能够被全世界科学家用于寻找新的重要蛋白,为诊断甚至治疗特异疾病提供一臂之力。(生物通 小粥)
我国蛋白质相互作用网络研究进展
蛋白质—蛋白质相互作用(PPI)决定着从转录调节到酶级链反应的几乎所有的生物功能,这方面的研究具有重要的科学价值和应用前景。目前的实验方法,如GSTpulldown和免疫共沉淀方法的通量还不足以满足蛋白质组相互作用网络研究的需要,酵母双杂交测定PPI的速度虽快,但精度不够。因此,发展理论方法在基因组水平上预测PPI及其相互作用网络,对功能基因组研究具有十分重要的意义,也是目前生命科学的前沿领域。目前大多数蛋白质—蛋白质相互作用预测方法需要同源蛋白信息或者蛋白相互作用标识物信息,这类方法能应用的范围有限,不能对一般化的蛋白质—蛋白质相互作用给出较好预测结果,更不能应用于大规模PPI网络的预测。
中科院上海生命科学研究院药物研究所蒋华良研究员带领学生张健和沈菊文等,经过两年努力,发明出一套预测蛋白质—蛋白质相互作用及其网络预测的新方法,预测精确性大于80%。该成果的论文于近日发表在国际权威学术刊物《美国科学院院刊》(PNAS)在线版上。
蒋华良等发现的方法是支持向量机算法——一种机器学习算法。科研人员首先将20种氨基酸根据极性和大小分成7类,并用连续的3个氨基酸作为一个单位来描述蛋白质序列,以降低蛋白质相互作用空间的复杂性。另外,科研人员还发展了新的内核函数,该函数考虑了蛋白相互作用的对称性,更适合于表征蛋白质—蛋白质的相互作用。然后用超过16000对实验测定的蛋白质—蛋白质相互作用结果构造了通用性PPI预测模型,使预测精确性大于80%,并能用于不同类型PPI网络的预测,意味着即使只获得蛋白质序列信息,该方法依然能够用于任意新蛋白的功能研究或预测老蛋白质的新功能。