PIFGSR:一种用于推荐系统中信息融合的可插拔框架,该框架结合了生成式人工智能(GenAI)技术

《Information Fusion》:PIFGSR: Pluggable framework for information fusion using generative artificial intelligence (GenAI) in recommender systems

【字体: 时间:2025年12月03日 来源:Information Fusion 15.5

编辑推荐:

  推荐系统中的生成式人工智能(GenAI)方法通过扩散模型缓解序列稀疏性问题,但存在噪声无序干扰逻辑关联和过度依赖领域先验的缺陷。本文提出PIFGSR框架,包含兴趣引导银行(PIGB)提取用户潜在兴趣模式,需求信息抽取机制(DIEM)融合时空注意力与统计归一化,以及引导匹配策略(GMS)确保生成序列与真实兴趣轨迹一致。实验表明PIFGSR在Yelp等数据集上NDCG@5指标提升9.85%,有效平衡生成可控性与用户兴趣建模

  
随着生成式人工智能(GenAI)在信息融合领域的快速发展,其在推荐系统中的创新应用逐渐成为研究热点。当前基于扩散模型的推荐系统在缓解数据稀疏性方面取得显著进展,但存在两大核心缺陷:首先,传统扩散模型通过全局随机噪声注入增强数据多样性,但破坏了用户行为序列的时空逻辑,导致生成的伪交互与真实兴趣轨迹存在偏差;其次,现有方法依赖人工设计的领域先验约束,在跨场景迁移时泛化能力受限,且动态平衡噪声强度与语义保真度的设计复杂度高,难以满足实时推荐需求。

针对上述问题,研究者提出了一种名为"可插拔信息融合生成框架(PIFGSR)”的创新解决方案。该框架通过三个核心组件的协同工作,实现了生成式模型与用户行为逻辑的深度适配。在技术架构层面,系统构建了双流融合机制:一方面保留预训练扩散模型的全局生成能力,另一方面通过可插拔的模块化设计注入用户兴趣特征。这种架构既保证了模型在稀疏数据下的基础生成能力,又通过定制化模块实现精准控制。

核心创新体现在三个模块的协同优化。首先,潜力兴趣引导银行(PIGB)采用动态参数矩阵学习机制,将预训练扩散模型输出的全局兴趣分布与用户实际交互数据相结合。通过构建可训练的兴趣模式库,系统能够捕捉到用户在特定场景下的隐性偏好特征,例如在电商场景中用户对促销活动的周期性关注,或在新闻推荐中用户对热点事件的即时响应模式。这种混合建模方式突破了传统扩散模型单一依赖全局噪声的局限,使生成过程能够自适应地平衡通用知识库与个性化需求。

在兴趣解耦机制方面,需求信息提取器(DIEM)采用空间-统计双重视角进行特征解构。通过构建行-列注意力网络,系统成功捕捉到用户交互序列中的局部时序关联,例如连续三天浏览同一品类商品的行为模式。同时,引入均值-方差联合归一化模块,在全局层面分析用户兴趣分布的集中趋势与离散特征,有效区分了用户的稳定偏好(如日常健身用品)与短期兴趣漂移(如季节性服饰需求)。这种双重解耦机制使得生成的伪交互序列既能保持局部行为逻辑的连贯性,又能符合全局兴趣分布的统计学规律。

引导匹配策略(GMS)通过构建双向注意力映射网络,实现了生成序列与原始交互轨迹的动态校准。系统在逆过程扩散阶段引入预训练推荐模型输出的用户兴趣向量,通过梯度引导机制实时调整噪声注入策略。实验数据显示,这种主动校准机制使生成序列的NDCG@5指标提升达9.85%,尤其在处理长尾用户行为时,系统能够有效识别冷启动用户的潜在兴趣拐点。

在工程实现层面,该框架设计了独特的轻量化训练范式。通过分离预训练扩散模型的固定参数与动态兴趣参数,系统在保持生成质量的同时显著降低了计算复杂度。以Yelp数据集为例,传统扩散模型需要32GB显存才能稳定训练,而PIFGSR通过参数共享机制将显存需求降低至18GB,同时将推理时延压缩至83ms以内,满足实时推荐场景的硬件约束。

实验验证部分采用四组基准数据集(Amazon, Yelp, MovieLens, ShoppingRec2020)进行对比测试。结果显示,PIFGSR在序列重构任务中平均准确率提升12.7%,多样性指标提高18.3%,同时将数据稀疏性对推荐效果的影响降低至传统方法的1/3。特别在处理冷门商品推荐时,系统通过动态兴趣引导机制,使冷门商品曝光率提升41.2%,验证了其在长尾优化方面的显著优势。

该框架的创新性还体现在模块的可插拔设计上。开发者可根据具体场景需求,灵活组合或替换核心组件。例如在医疗推荐场景中,可将PIGB替换为医学知识图谱注入模块,同时保留DIEM的空间注意力机制。这种模块化架构使系统能够快速适应不同行业的业务需求,降低技术迁移成本。

从技术演进角度看,PIFGSR标志着生成式推荐系统从数据增强向智能信息融合的范式转变。传统方法主要依赖数据扩容,而PIFGSR通过构建"预训练-动态学习"的双循环机制,实现了从静态特征提取到动态兴趣建模的跨越。这种范式转变使得推荐系统在应对用户兴趣漂移时,既能保持对历史行为的连贯理解,又能及时捕捉新出现的兴趣节点。

未来研究方向建议在以下领域深化探索:首先,可结合强化学习技术,构建用户兴趣的动态演进模型,使推荐系统能够实时追踪兴趣拐点;其次,针对多模态数据融合,可将视觉特征与文本描述进行联合编码,提升跨模态推荐效果;此外,引入联邦学习框架实现跨平台数据协同训练,将有效突破数据孤岛带来的模型性能瓶颈。这些技术延伸方向有望进一步提升生成式推荐系统的实际应用价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号