
-
生物通官微
陪你抓住生命科技
跳动的脉搏
深度学习分子嵌入的数据融合在属性预测中的应用
《Journal of Chemical Information and Modeling》:Data Fusion of Deep Learned Molecular Embeddings for Property Prediction
【字体: 大 中 小 】 时间:2025年10月28日 来源:Journal of Chemical Information and Modeling 5.3
编辑推荐:
数据稀疏性制约多任务学习模型性能,提出融合预训练单任务模型嵌入的方法,通过复用预训练嵌入减少参数量并提升预测效果,在量子化学数据集及新收集的实验数据集上验证有效性。

基于数据驱动的方法(如深度学习)能够生成具有极高准确性和效率的材料属性预测模型。然而,在许多应用中,数据较为稀疏,这严重限制了这些模型的准确性和适用性。为提高预测性能,人们采用了迁移学习和多任务学习等技术。多任务学习模型的性能取决于任务之间的关联强度以及数据集的完整性。当在数据稀疏且任务间关联较弱的情况下进行训练时,标准的多任务模型往往表现不佳。为了解决这一问题,我们融合了由独立预训练的单任务模型生成的深度学习嵌入,从而构建了一个能够继承丰富、特定于材料属性表示的多任务模型。通过重用这些嵌入(而非重新训练),融合模型相较于标准多任务模型表现得更好,并且所需的训练参数更少。我们在一个广泛使用的量子化学数据基准集上验证了这一技术,该数据集涵盖了小分子的信息;同时,我们还使用了一个新编译的、包含来自文献以及我们自身量子化学和热化学计算结果的稀疏实验数据集进行了测试。
生物通微信公众号
知名企业招聘