利用机器学习解析癌症磷酸化蛋白质组 “暗物质”,发现潜在治疗靶点

《Nature Communications》:

【字体: 时间:2025年03月21日 来源:Nature Communications

编辑推荐:

  在蛋白质磷酸化研究中,多数磷酸化位点(phosphosite)的调控和功能未知,限制了从磷酸化蛋白质组数据中获取有效生物学信息。研究人员整合机器学习与 1195 例肿瘤标本的磷酸化蛋白质组数据,构建 CoPheeMap 和 CoPheeKSA,揭示激酶 - 底物关联,为癌症研究提供新思路。

  在生命科学的微观世界里,蛋白质磷酸化就像一把神奇的 “钥匙”,掌控着细胞的增殖、分化、运动和凋亡等重要 “大门”。蛋白质磷酸化由蛋白激酶和磷酸酶精准调控,一旦失衡,尤其是激酶活性异常,就可能引发疾病,癌症便是其中的 “恶魔”。因此,激酶成为研发癌症疗法的热门 “靶点”,自 2001 年伊马替尼获批治疗慢性髓性白血病以来,已有 70 多种激酶抑制剂用于癌症治疗。但人类基因组编码的 500 多种蛋白激酶中,目前仅有 50 种被 “攻克”,其余大部分仍等待探索。
与此同时,基于质谱(MS)的磷酸化蛋白质组学技术兴起,它能全面分析生物样本中的磷酸化事件,为癌症研究带来新希望。然而,这一技术也面临困境:大量磷酸化位点缺乏功能和调控信息,不到 5% 的人类磷酸化蛋白质组与特定激酶相关,功能明确的磷酸化位点更是少之又少,这部分未知的磷酸化位点被称为 “暗磷酸化蛋白质组”。为了照亮这片 “黑暗”,美国贝勒医学院(Baylor College of Medicine)等机构的研究人员展开了一项重要研究,相关成果发表在《Nature Communications》杂志上。

研究人员利用机器学习技术,整合美国国家癌症研究所临床蛋白质组肿瘤分析联盟(CPTAC)提供的 11 种癌症类型、1195 例临床肿瘤标本的磷酸化蛋白质组数据,构建了一个包含 26,280 个磷酸化位点共调节网络 CoPheeMap。接着,他们将 CoPheeMap 的网络嵌入特征融入名为 CoPheeKSA 的机器学习模型中,用于预测激酶 - 底物关联(KSAs)。

在构建 CoPheeMap 时,研究人员发现磷酸化位点共磷酸化、序列相似性以及宿主蛋白激酶相互作用谱相似性是共调节的有效预测指标。他们运用极端梯度提升(XGBoost)算法,综合这些特征构建分类器,识别出 764,049 对共调节的磷酸化位点,进而构建成 CoPheeMap 网络。通过多种分析手段验证,CoPheeMap 能够有效捕捉磷酸化位点之间的共调节关系,功能相关的位点在网络中距离更近,且该网络中的磷酸化位点更具功能相关性。

在 CoPheeKSA 模型构建和预测方面,研究人员整合了 CoPheeMap 的磷酸化位点共调节信息、激酶共表达数据以及功能关联信息,构建激酶网络(KMap)。然后,运用 Node2Vec 算法生成磷酸化位点和激酶的低维向量表示,并结合位置特异性评分矩阵(PSSM)分数、激酶与底物的相关性等特征,训练 XGBoost 模型预测 KSAs。CoPheeKSA 模型表现出色,在 10 次蒙特卡罗验证中,其中位数受试者工作特征曲线下面积(AUROC)达到 0.95,显著优于其他基于 PSSM 的预测方法。该模型预测出 24,015 个 KSAs,涉及 9399 个磷酸化位点和 104 种激酶,包括 26 种研究较少的激酶。通过与实验确定的底物特异性数据对比,进一步验证了 CoPheeKSA 预测的高质量。

研究人员还通过研究功能重要但上游激酶未知的磷酸化位点,以及癌症相关的磷酸化位点,展示了 CoPheeMap 和 CoPheeKSA 的实用性。对于功能重要的磷酸化位点,CoPheeKSA 为部分位点预测了上游激酶,如 CD74S8、PRKCAT497和 HSP90AB1S226等,还通过 CoPheeMap 为其他位点提供了有用信息。在癌症相关磷酸化位点研究中,通过对肿瘤和正常组织样本的差异分析,结合 CoPheeKSA 预测的结果进行富集分析,发现了多个与癌症相关的激酶,包括周期蛋白依赖性激酶(CDKs)家族中的 CDK12 等,以及其他如丝氨酸 - 精氨酸蛋白激酶 1(SRPK1)等研究较少的激酶,为癌症研究提供了新的潜在治疗靶点和研究方向。

这项研究意义重大,它通过构建 CoPheeMap 和 CoPheeKSA,为研究磷酸化位点的调控和功能提供了全面的框架,有助于深入理解癌症中的信号转导过程。不过研究也存在一些局限,如酪氨酸数据较少限制了对酪氨酸激酶的研究,模型训练数据存在偏向性等。未来研究可从纳入更多酪氨酸数据、利用无偏数据减少偏向性、纳入磷酸酶相关特征以及整合更多癌症类型数据等方面进行改进,进一步推动癌症研究和治疗的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号