面向异构表格数据的智能参数迁移学习方法研究

【字体: 时间:2025年10月22日 来源:Neurocomputing 6.5

编辑推荐:

  本文针对异构表格数据迁移学习(Transfer Learning)中的特征对齐难题,提出了一种基于统计特征映射的创新方法。该方法通过计算变量间统计相似性实现跨数据集参数迁移,解决了传统方法在特征维度/顺序不匹配时的局限性,为医疗健康等小样本场景提供了更科学的迁移学习方案。

  
亮点
  • 首次系统研究特征维度/顺序异构的表格数据迁移学习问题
  • 提出基于统计特征相似性的变量对齐方法
  • 通过合成数据与真实场景验证方法有效性
相关研究
多种方法被提出解决异构迁移学习问题。常见策略包括将特征映射到公共子空间,使源域和目标域的特征空间转换为共享表示[18-22]。另一种方法是根据源域实例与目标域的相关性分配权重,使模型能聚焦最相关的样本进行知识迁移。
问题描述
我们考虑m个数据集{D1, D2, ..., Dm},每个Dk是预测变量-响应对的集合。每个数据点xki ∈ Xk ? Rdk,其中Fk = (fk1, fk2, ..., fkdk)表示对应Xk的特征,dk是特征数。在此设置中,我们考虑数据集的特性:对于任意j,k,Fj ∩ Fk ≠ ?,即任意两个数据集有共同特征,但特征数可能不同,更重要的是任何两个特征在特定位置上的排序可能存在差异。
实验
这里我们展示了所提方法在高效迁移学习中的有效性。实验中使用了合成数据集和真实数据集。合成数据集经过精心设计,用于模拟各种场景以进行受控实验。
讨论与结论
本文工作解决了传统迁移学习方法中一个关键但常被忽视的局限性,特别是在处理特征空间非 identical 的源-目标对时。迁移学习的本质假设是跨数据集的特征不仅相似,而且在排列顺序上具有对应关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号