基于对比学习的激酶抑制剂活性与选择性预测新方法MMCLKin
《Nature Communications》:Enhancing kinase-inhibitor activity and selectivity prediction through contrastive learning
【字体:
大
中
小
】
时间:2025年12月04日
来源:Nature Communications 15.7
编辑推荐:
本研究针对激酶抑制剂开发中因结构保守性导致的低选择性难题,提出了MMCLKin框架。该研究通过整合几何图网络与序列网络,结合多模态多尺度对比学习,实现了激酶-抑制剂亲和力与选择性的精准预测。实验表明,该方法在十个不同蛋白-药物数据集上表现出强泛化性,并成功筛选出对LRRK2 G2019S突变体具有纳摩尔级抑制活性的先导化合物,为激酶靶向药物发现提供了新工具。
蛋白激酶作为细胞信号转导的关键调控因子,已成为21世纪最重要的药物靶点之一。然而,激酶ATP结合位点的高度保守性导致抑制剂选择性难以保障,传统湿实验筛选成本高昂且通量有限。随着人工智能技术的发展,深度学习模型为激酶-抑制剂相互作用预测提供了新思路,但现有方法在三维结构信息利用、多尺度特征融合等方面仍存在局限。
发表于《Nature Communications》的这项研究提出了MMCLKin框架,通过创新性地整合几何图神经网络与预训练语言模型,结合多模态多尺度对比学习策略,实现了激酶抑制剂活性与选择性的精准预测。该研究首先构建了高质量的三维激酶-药物数据集3DKDavis和3DKKIBA,利用AlphaFold2预测的激酶结构域和能量最小化的分子构象作为输入。MMCLKin的核心创新在于设计了注意力一致性引导的对比学习机制(MMCLAC),能够同时捕捉序列模态的进化信息和三维结构的空间特征,并在局部原子层面和全局结构层面进行特征对齐。
关键技术方法包括:基于EComENet的几何图神经网络处理三维结构特征,ESM和ChemBERTa-2预训练模型提取序列信息,多头注意力机制量化相互作用贡献度,以及节点级对比学习实现跨模态特征对齐。模型在激酶冷启动和药物冷启动等挑战性场景下均表现出优异性能。
MMCLKin在激酶-药物结合亲和力预测中表现稳健
研究团队通过系统评估证实,基于AlphaFold2结构构建的数据集显著提升了模型性能。在3DKDavis数据集上,MMCLKin在激酶冷启动设定下较最优序列方法PSICHIC的MSE降低17.74%,在激酶-药物冷启动场景下较DrugBAN的MAE降低16.26%。五折交叉验证进一步验证了模型的稳定性,且不确定性校准分析显示模型在低不确定性区域预测可靠性更高。
MMCLKin准确预测激酶抑制剂在全激酶组的选择性
通过标准分数、基尼系数、选择性熵和分配指数等四项指标的综合评估,MMCLKin在3DKDavis数据集上分别达到0.898、0.537、0.651的皮尔逊相关性,显著优于对比模型。这表明模型能有效区分抑制剂对不同激酶的细微结合差异,为高选择性抑制剂设计提供指导。
在包含PDBbind、七大类靶标超家族和IDG-DREAM挑战赛数据集的测试中,MMCLKin在CASF-2016基准集上达到RMSE 1.291、PCC 0.807,优于多数基于实验结构的模型。特别是在GPCR、离子通道等非激酶蛋白家族上的强劲表现,证明了其跨蛋白家族的适用性。
MMCLKin在已知实验结构激酶靶点展示强大虚拟筛选能力和可解释性
针对LRRK2(PDB: 8FO7)和HPK1(PDB: 7R9N)的虚拟筛选中,MMCLKin在top 1%召回率分别达到45.45%和42.86%,显著优于Schr?dinger Glide SP方法。注意力可视化分析成功识别出铰链区关键残基(如LRRK2的Glu1948、Ala1950)和抑制剂极性官能团,与实验验证的结合模式高度一致。
对于NUAK2和CRK12等缺乏实验结构的激酶,MMCLKin基于AlphaFold2预测结构的虚拟筛选中仍保持竞争优势,在CRK12的top 5%召回率达到53.85%。模型可解释性分析再次验证其能准确捕捉β-折叠区关键残基和分子极性基团。
生物学活性验证证实MMCLKin发现突变激酶抑制剂的潜力
通过ADP-Glo实验验证,20个MMCLKin筛选化合物中有5个对致病性LRRK2 G2019S突变体显示大于50%抑制率,其中LY2025-04(FN-1501)的IC50达8.694 nM,与阳性对照LRRK2-IN-1(7.001 nM)相当。LY2025-02(sbp-7455)表现出2.081 nM的超高 potency,而获批药物Befotertinib(LY2025-05)的130.3 nM活性则提示其治疗帕金森病的重定位潜力。
本研究发展的MMCLKin框架通过多模态多尺度特征融合策略,有效解决了激酶抑制剂选择性预测的难题。其不依赖实验晶体结构的特点,为靶向未解析结构蛋白的药物发现提供了新范式。注意力机制赋予模型良好的可解释性,能识别关键结合残基和药效团,为理性药物设计提供直接指导。实验验证进一步证实了其在突变激酶抑制剂发现中的实用价值,为攻克临床耐药突变等挑战提供了新工具。该框架的通用性设计暗示其可扩展至其他保守蛋白家族,具有广阔的临床应用前景。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号