基于自适应信息融合的概念漂移学习方法,用于处理不断演变的多数据流

《IEEE Transactions on Knowledge and Data Engineering》:Adaptive Information Fusion-Based Concept Drift Learning for Evolving Multiple Data Streams

【字体: 时间:2025年12月03日 来源:IEEE Transactions on Knowledge and Data Engineering 10.4

编辑推荐:

  概念漂移与多数据流学习中的自适应信息融合方法研究

  

摘要:

概念漂移是由于数据分布的不可预测变化而产生的,这会降低模型的性能。在不断演变的多数据流中,由于动态变化和不确定的流间相关性,这些漂移带来了更大的挑战,需要模型具备强大的准确性和泛化能力。为了解决这个问题,本文提出了一种新的多数据流学习方法,称为基于自适应信息融合的概念漂移学习(AIF-CD)方法,该方法能够自适应地处理具有异构特征空间和复杂漂移情况的多数据流。首先,我们提出了一种实时学习方法,并结合了合作机制来处理多数据流。其次,设计了一种基于信息融合的增强过程,以提高每个数据流的学习效率。接下来,引入了一种基于漂移严重程度识别的适应策略以及选择性使用先前时间戳数据的过程,以增强同步和异步场景下的学习鲁棒性。此外,详细的运行时复杂性和理论分析进一步解释了该方法的学习效率。我们的关键创新在于将实时适应性与理论保障相结合,适用于复杂且不断演变的多数据流学习。在同步和异步设置下的实验结果表明,所提出的方法比其他基准方法更有效。

引言

在现实世界中,多数据流非常普遍。例如,不同地区的天气模式会发生变化,各个行业的股票价格也呈现出不同的趋势。这些不断演变的场景反映了非平稳多数据流的动态和自适应特性。不确定的变化也可能导致概念漂移,从而降低机器学习模型的性能[1]、[2]、[3]。为了解决数据流中的概念漂移问题,已经提出了一些方法[4]。然而,大多数现有方法都集中在单个数据流上[5]、[6],只有少数方法考虑了多数据流学习。如图1所示,这种设置涉及处理来自具有变化数据分布和未知流间相关性的异构特征空间的数据流,这是一个复杂且具有挑战性的问题,最近受到了广泛关注。因此,我们的主要目标是开发一种高效的学习方法,用于处理具有概念漂移的演变多数据流。

研究问题的示意图。在我们的多数据流学习环境中,具有不确定相关性和漂移情况的数据流来自不同的特征空间,这些特征空间通过不同的形状来表示,体现了多数据流之间的异构性。研究问题是如何确保机器学习模型能够高效地处理多个数据流。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号