
-
生物通官微
陪你抓住生命科技
跳动的脉搏
BitterTranslate:一个基于自然语言处理和机器学习的框架,用于映射苦味受体激动作用
《Journal of Chemical Information and Modeling》:BitterTranslate: A Natural Language Processing and Machine Learning-Based Framework for Mapping Bitter Taste Receptor Agonism
【字体: 大 中 小 】 时间:2025年10月28日 来源:Journal of Chemical Information and Modeling 5.3
编辑推荐:
苦味受体配体预测算法BitterTranslate基于双BERT模型(分子特征提取+受体特征提取)结合XGBoost分类器,在TAS2R14中达到83%精度和88%召回率,提升配体预测效率。

苦味受体(TAS2Rs)是一种G蛋白偶联受体(GPCRs),主要表达在舌头上,但也存在于许多口腔外的组织中。TAS2R配体被用于提高苦味药物的依从性、治疗各种疾病以及研究这些受体的口腔外功能。尽管机器学习作为一种有前景的药物发现工具可以用来预测TAS2R激活剂,但获取高质量的特征数据进行训练既耗时又依赖于专门的软件。本研究探索了变换器(一种用于从序列文本中提取特征的神经网络架构,已在基于自然语言处理的任务中带来革命性突破)在预测这些配体方面的潜力。因此,BitterTranslate这种TAS2R激动剂预测算法仅需要配体的简化分子输入线格式(SMILES)字符串和TAS2R的氨基酸序列。该算法基于两种双向编码器表示(BERT)模型构建:一种模型针对小分子进行训练以提取配体特征,另一种模型针对GPCRs进行训练以提取受体特征。XGBoost分类器在大型GPCR-配体数据集上进行了预训练,并在较小的TAS2R-配体数据集上进行了微调。BitterTranslate在所有TAS2R上的预测准确率为80%,召回率为65%;对于数据最多的TAS2R14,其预测准确率为83%,召回率为88%。
生物通微信公众号
知名企业招聘