综述:深度学习应用于虚拟筛选和分子动力学技术的初学者指南

【字体: 时间:2025年04月09日 来源:Journal of Cheminformatics 7.1

编辑推荐:

  这篇综述系统阐述了深度学习(DL)在虚拟筛选(VS)和分子动力学(MD)中的创新应用,涵盖结合亲和力预测(如Pafnucy)、构象采样(如DeepDriveMD)和神经网络势能(NNP)等前沿技术。作者通过案例解析(如AlphaFold 3的分子对接突破)揭示了DL如何突破传统计算化学的硬件与算法限制,为药物设计和生物物理研究提供新范式。

  

深度学习正在重塑计算化学的研究范式。这篇综述以虚拟筛选(VS)和分子动力学(MD)为切入点,系统梳理了深度学习(DL)技术在这两个领域的革命性应用。

在虚拟筛选方面,DL技术已实现从分子描述符生成到结合位点预测的全流程创新。Mol2vec通过自然语言处理技术将分子亚结构转化为向量空间,其衍生的IVS2vec模型在反向虚拟筛选中表现出色。DEEPScreen则突破传统分子指纹限制,采用CNN直接解析二维分子图像预测靶点相互作用。更引人注目的是生成对抗网络(GAN)和变分自编码器(VAE)的应用,如Andrianov开发的HIV-1抑制剂生成系统,以及Das设计的抗菌肽(AMP)生成框架CLaSS,后者通过Wasserstein自编码器(WAE)实现了序列关系的精准捕捉。

分子对接领域正经历DL技术的颠覆性变革。EquiBind和TANKBind等图神经网络(GNN)实现了单次预测的盲对接,而DiffDock通过扩散模型迭代优化对接构象,将成功率提升至传统方法的2倍。最新的AlphaFold 3更是突破性地实现了蛋白质-配体复合结构的联合预测,其精度超越AutoDock Vina等经典工具。

在分子动力学领域,DL技术主要从三个维度推动创新。构象采样方面,Degiacomi开发的生成式自编码器(AE)能有效插值蛋白质中间态构象;Ma团队则将卷积变分自编码器(CVAE)与MD结合创建了DeepDriveMD框架,显著加速蛋白质折叠采样。神经网络势能(NNP)的发展尤为瞩目,从第一代基于笛卡尔坐标的简单网络,演进至第四代包含长程电荷转移的HDNNP,其中ANI(ANAKIN-ME)模型对有机分子的能量预测已达到DFT精度。轨迹分析方面,结合tICA降维和变分动力学编码器(VDE)的方法,实现了突变蛋白构象空间的高效探索。

这些技术突破背后仍存在重要挑战。结合亲和力预测模型的泛化能力受限于训练数据偏差,如Volkov指出的"记忆而非学习"现象。NNP的开发也面临参考数据集构建耗时、长程相互作用计算复杂等瓶颈。然而毋庸置疑,DL技术正在突破传统分子模拟的时空限制,为从药物发现到生物物理研究的广泛领域注入新动能。正如AlphaFold 3展现的潜力,DL与计算化学的深度融合将持续催生突破性研究工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号