
-
生物通官微
陪你抓住生命科技
跳动的脉搏
一种三模态蛋白质语言模型能够实现高级蛋白质搜索功能
《Nature Biotechnology》:A trimodal protein language model enables advanced protein searches
【字体: 大 中 小 】 时间:2025年10月03日 来源:Nature Biotechnology 41.7
编辑推荐:
ProTrek通过对比学习整合蛋白质序列、结构和自然语言功能,形成三模态语言模型,支持跨模态及模内全面搜索,显著优于Foldseek和MMseqs2的速度和准确性,其服务器可高效处理大规模蛋白质数据库。
ProTrek通过对比学习将蛋白质序列、结构和自然语言功能统一在一个三模态语言模型中,实现了任意两种模态之间的全面搜索(包括同一模态内的搜索)。在识别功能相关的蛋白质方面,ProTrek在速度和准确性上均优于现有的比对工具(例如Foldseek和MMseqs2)。计算实验和湿实验室验证表明,ProTrek服务器(www.search-protrek.com)拥有超过50亿种蛋白质的预计算嵌入信息,能够高效处理和分析大规模蛋白质数据库。
生物通微信公众号
知名企业招聘