然而,目前在这一领域的研究却遇到了不少难题。现有的关键蛋白识别方法大多局限于单个物种的蛋白质 - 蛋白质相互作用(PPI,Protein - Protein Interaction)网络,没有充分利用不同物种之间蛋白质的同源关系。要知道,同源蛋白往往在多个物种间高度保守,它们就像细胞世界里的 “通用零件”,在不同物种中发挥着相似的重要功能。如果能利用好这些同源关系,将有助于更准确地识别关键蛋白。此外,一些构建多层 PPI 网络的方法,仅仅基于两个物种间的同源关系构建层间连接,却没有考虑到这些连接的生物学意义,也没有将同源关系扩展到更多物种,导致对层间连接重要性的评估不够准确。
为了解开这些谜团,来自吉林大学的研究人员展开了一项重要研究。他们提出了一种名为 MLPR(Multilayer PPI Networks based on Homologous Proteins and Multiple PageRank)的全新模型,旨在通过构建基于同源蛋白的多层 PPI 网络,并整合多个 PageRank 算法来更精准地识别关键蛋白。该研究成果发表在《BMC Bioinformatics》上。
研究人员在这项研究中用到了多个关键技术方法。首先,他们整合了酵母、果蝇和人类三个物种的多种生物数据,包括同源蛋白、基因表达、亚细胞定位和蛋白质复合物等信息,以此初始化蛋白质的分数。接着,构建多层 PPI 网络的层内和层间转移矩阵,在构建过程中综合考虑多种因素来确定矩阵权重。最后,基于多层 PPI 网络开发了多 PageRank 模型,并引入三个关键参数优化模型,还提出了两步优化策略调整参数。