一种三模态蛋白质语言模型能够实现高级蛋白质搜索功能

《Nature Biotechnology》:A trimodal protein language model enables advanced protein searches

【字体: 时间:2025年10月03日 来源:Nature Biotechnology 41.7

编辑推荐:

  ProTrek通过对比学习整合蛋白质序列、结构和自然语言功能,形成三模态语言模型,支持跨模态及模内全面搜索,显著优于Foldseek和MMseqs2的速度和准确性,其服务器可高效处理大规模蛋白质数据库。

  

摘要

ProTrek通过对比学习将蛋白质序列、结构和自然语言功能统一在一个三模态语言模型中,实现了任意两种模态之间的全面搜索(包括同一模态内的搜索)。在识别功能相关的蛋白质方面,ProTrek在速度和准确性上均优于现有的比对工具(例如Foldseek和MMseqs2)。计算实验和湿实验室验证表明,ProTrek服务器(www.search-protrek.com)拥有超过50亿种蛋白质的预计算嵌入信息,能够高效处理和分析大规模蛋白质数据库。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号