
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:蛋白质-核酸复合物结构研究的数据库和网络工具
【字体: 大 中 小 】 时间:2025年06月12日 来源:Current Opinion in Structural Biology 6.1
编辑推荐:
这篇综述系统梳理了蛋白质-DNA/RNA复合物的结构研究资源,涵盖实验数据库(PDB/EMDB/BMRB)、衍生数据库(NAKB/3D-footprint)和AI预测工具(AlphaFold3/Chai-1),指出该领域工具稀缺性源于蛋白质与核酸结构整合方法的不足,并展望AI技术将推动该领域发展。
蛋白质与核酸的相互作用是生命活动的核心,涉及DNA复制修复、RNA加工、基因调控等关键过程。三维结构研究为理解这些分子机制提供了原子级视角,但相关研究资源远少于蛋白质-蛋白质相互作用领域。
蛋白质数据库(PDB)作为结构生物学的基石,收录了近1.5万组蛋白质-核酸复合物结构,占其总条目不足6%。冷冻电镜(cryo-EM)技术的"分辨率革命"使该技术成为当前主要研究手段,2023-2024年70%以上新解结构采用此方法。电子显微镜数据库(EMDB)存储原始电镜图谱,其中5446张与蛋白质-核酸复合物相关。核磁共振数据库(BMRB)和小角散射数据库(SASBDB)则分别提供动态结构信息和溶液状态低分辨率数据,后者包含451组异源复合物数据。
核酸知识库(NAKB)对PDB中的核酸结构进行深度注释,包含14671个条目。3D-footprint和DNAproDB专注于蛋白-DNA结合特异性分析,前者提供10803组复合物的结合位点数据。新兴的RNAproDB则实现蛋白-RNA相互作用可视化,支持用户上传结构分析。值得注意的是,PPI3D数据库将蛋白质-核酸界面按序列和结构相似性聚类,收录达16万个界面,为分子对接研究提供重要参考。
AlphaFold3的发布标志着蛋白质-核酸复合物预测进入新纪元,其可同时处理蛋白质、核酸、配体等组分。尽管当前预测精度仍低于纯蛋白质模型(CASP15实验中蛋白-RNA复合物预测全部失败),但Chai-1、Boltz-1等后续模型正在快速跟进。传统分子对接工具如HADDOCK和NPDock在组分构象变化较小时仍具应用价值,但需结合实验数据验证。
VoroContacts通过Voronoi镶嵌算法分析接触界面,可精确到原子级分辨率。CAD-score和US-align分别采用非叠加局部比较和全局比对策略,适应不同类型复合物结构评估。DeepPBS利用几何深度学习预测蛋白-DNA结合特异性,突破了传统3D-footprint仅支持预分析数据的限制。
当前主要瓶颈在于实验数据匮乏——PDB中蛋白质-核酸复合物仅占蛋白-蛋白复合物的7.5%。CRISPR-Cas系统等特殊家族虽有REBASE、CasPEDIA等专题数据库,但整体覆盖不足。随着AlphaFold3等AI模型迭代和CASP实验增加核酸靶标数量,未来五年或将迎来结构预测精度的突破,这将显著推动基因治疗和合成生物学等领域发展。专业工具的整合化成为趋势,如PPI3D已实现蛋白质-核酸-配体相互作用统一分析框架,为跨学科研究提供新范式。
生物通微信公众号
知名企业招聘