知识交互与扩散增强的知识图谱推荐系统KIDRec:融合高阶语义挖掘与自适应对比学习的新框架

《Journal of Web Engineering》:Knowledge Interaction and Diffusion Augmentation for Knowledge Graph Recommendation

【字体: 时间:2025年12月01日 来源:Journal of Web Engineering 1

编辑推荐:

  为解决知识图谱推荐系统中高阶关联挖掘不足、表示学习鲁棒性差及对比学习优化困难等问题,研究人员开展了一项融合知识交互与扩散增强的知识图谱推荐研究。提出的KIDRec框架通过多层显式特征交叉网络挖掘知识图谱三元组深层语义,采用扩散模型对协同用户/项目嵌入进行"噪声注入-去噪"以增强表示鲁棒性,并结合硬负样本增强与动态温度系数的自适应对比学习模块。在Book-Crossing、Last.FM和MovieLens20m数据集上实验显示,AUC分别达到0.782、0.877和0.979,相对基线最高提升0.032,有效缓解了数据稀疏性问题。

  
在人工智能技术飞速发展的今天,推荐系统作为其核心应用之一,已成为众多在线服务的"智慧大脑"。无论是电商平台的商品推荐,还是流媒体内容推送,亦或是教育资源的个性化匹配,推荐系统都在帮助用户从信息海洋中精准捕捉兴趣点。然而,传统的协同过滤算法虽然高效稳健,却难以摆脱"冷启动"和数据稀疏的桎梏——当用户行为数据不足时,推荐效果往往大打折扣。
知识图谱(KG)的出现为这一困境带来了转机。这种结构化语义网络能够以三元组形式存储实体间复杂关系,为推荐系统注入丰富的背景知识。例如,通过"用户A喜欢《三体》→《三体》作者是刘慈欣→刘慈欣著作《流浪地球》"这条推理路径,系统可以推断用户A可能对同类科幻作品感兴趣。但知识图谱的高维异构特性也带来了新挑战:如何深度挖掘相关知识并过滤噪声信息成为当前研究的难点。
现有知识图谱推荐方法主要分为基于嵌入、基于路径和基于传播三类。基于嵌入的方法如CKE、DKN通过知识图谱嵌入(KGE)获取低维向量表示,但可解释性较弱;基于路径的方法依赖人工设计元路径,易导致过拟合;基于传播的方法如RippleNet、KGCN通过图神经网络(GNN)在协同知识图(CKG)上递归传播,虽能捕获高阶语义,但仍存在协同信息利用不足的问题。
针对这些挑战,张德清与Mideth Abisado团队在《Journal of Web Engineering》上提出了KIDRec框架,创新性地将知识交互、扩散模型与自适应对比学习相结合。该研究旨在通过多层次技术融合,提升知识图谱推荐系统在复杂场景下的性能表现。
研究方法上,团队首先构建多阶协同传播层,通过用户行为图和知识图分别捕获用户协同偏好与项目知识上下文;接着设计知识交互层,采用CrossNet结构显式建模用户-项目嵌入与KG信息的双向交互;创新性地引入知识扩散模块,对协同表示进行噪声注入与去噪以增强鲁棒性;最后开发自适应对比学习模块,通过硬负样本挖掘和动态温度系数优化表示区分度。实验采用Book-Crossing、Last.FM和MovieLens20m三个公开数据集,以AUC和F1作为评估指标。
研究结果方面,在参数影响分析中,批量大小(batch_size)实验显示:当batch_size从512增至4096时,三个数据集的AUC均呈上升趋势,表明较大批量可提供更稳定的梯度估计。嵌入维度实验发现,维度增至32时模型表现快速提升,继续增加则效果趋于平缓,说明适度维度能平衡表达力与过拟合风险。传播深度测试表明,对于数据稀疏的Book-Crossing和Last.FM数据集,3层传播效果最优,而数据丰富的MovieLens20m对深度变化不敏感。
消融实验进一步验证了各模块贡献:移除知识交互层(KI)使Book-Crossing的AUC下降0.0934,证明该模块对挖掘深层语义关联至关重要;移除知识扩散模块(KD)和自适应对比学习模块(ACL)也导致性能下降,表明扩散去噪与硬负样本增强能有效提升表示质量。在横向对比中,KIDRec在三个数据集上的AUC分别达到0.782、0.877和0.979,较最佳基线提升0.031、0.032和0.002,尤其在稀疏数据集上优势显著。
结论部分指出,KIDRec框架通过知识交互层实现KG三元组的多层显式交互,利用扩散模型对协同表示进行增强,再通过自适应对比学习优化嵌入空间结构,形成完整的技术闭环。该研究不仅为知识图谱推荐提供了新的架构范式,更通过可调节的硬负样本挖掘机制和动态温度系数,为对比学习在推荐系统的应用提供了新思路。未来工作将聚焦于模型复杂度优化,在保证性能的同时提升计算效率。
这项研究的创新之处在于:首次将扩散模型的"生成-去噪"机制系统性地引入知识图谱表示学习,突破传统GNN聚合的局限性;通过CrossNet实现异构关系的显式交叉,更好保留知识图谱中不同关系类型(如对称的"相似于"与非对称的"撰写于")的语义特性;提出的动态温度调整策略使模型在训练初期广泛探索样本空间,后期聚焦难样本区分,实现训练过程的智能化控制。这些技术组合为处理现实世界中复杂多变的推荐场景提供了新的解决方案。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号