一种采用双重编码机制进行特征选择的二进制粒子群优化算法

《Engineering Applications of Artificial Intelligence》:A binary particle swarm optimization with dual encoding mechanism for feature selection

【字体: 时间:2025年10月02日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  特征选择是机器学习预处理的关键步骤,本文提出基于双编码机制的新型二进制粒子群优化算法DEBPSO,采用逆S型转移函数和布尔编码提升探索能力,并设计游戏机制平衡探索与利用。实验在27个UCI数据集上验证,DEBPSO在17个数据集的分类错误率上显著优于对比算法,特征筛选效率提升明显。

  特征选择是机器学习中的一个关键预处理步骤,广泛应用于多个领域,如生物图像分析、自然语言处理以及语音病理研究等。随着科学技术的快速发展,数据集中的特征数量不断增加,这使得“维度灾难”问题日益突出。冗余、无关或不必要的特征不仅会增加计算复杂度,还可能降低分类任务的性能。因此,如何高效地从原始数据中筛选出最具代表性的特征成为研究的重要方向。

目前,特征选择方法主要分为四类:过滤法、包装法、嵌入法和混合方法。过滤法通过统计方法评估特征子集的重要性,不依赖于具体的机器学习模型。常见的过滤法包括单变量方法和多变量方法,如信息增益、增益比、基尼指数、Fisher得分等。而包装法则通过训练和评估模型来判断特征子集的优劣,通常需要结合特定的学习算法作为评价标准。这类方法虽然在准确性上表现优异,但计算成本较高,且容易陷入局部最优解。

近年来,越来越多的元启发式算法被应用于特征选择问题。这些算法具有较强的全局搜索能力,能够有效探索特征空间。然而,大多数现有的元启发式算法主要针对连续优化问题,对于特征选择这种典型的二进制优化问题,其性能仍有待提升。因此,研究者们提出了多种编码机制,包括转换函数机制、量子机制和布尔编码机制,以更好地将连续空间映射到二进制空间。其中,转换函数机制被广泛用于解决这一问题,常见的转换函数包括S型、V型、U型、Z型、Taper型、线性型、二次型以及正弦或余弦函数等。此外,时间变化型转换函数和基于Mamdani模糊推理系统的模糊转换函数也被引入以优化搜索过程。

在布尔编码机制方面,研究者们开发了多种基于布尔编码的元启发式算法,用于解决二进制优化问题。这些算法包括用于天线设计的双频双极化平面天线优化、0/1背包问题求解以及高价值项集挖掘等。对于特征选择问题,也有不少研究采用了布尔编码机制,如结合进化种群动态(EPD)策略的布尔粒子群优化(BPSO)算法,以及用于情感分类的生物启发式布尔人工蜂群(ABC)算法等。这些方法通过调整粒子的运动策略和更新规则,提高了在二进制搜索空间中的探索和利用效率。

在众多元启发式算法中,粒子群优化(PSO)因其强大的全局搜索能力和易于实现的特点,成为解决特征选择问题的热门方法之一。然而,传统的PSO算法在处理二进制优化问题时仍存在一些挑战,例如转换函数的性能不足、算法容易陷入局部最优等。为了解决这些问题,本文提出了一种新的二进制粒子群优化算法,命名为DEBPSO(Dual Encoding Binary Particle Swarm Optimization)。该算法结合了转换函数机制和布尔编码机制,旨在提高算法在二进制搜索空间中的探索能力,同时平衡探索与利用的效率。

DEBPSO的核心创新点在于引入了一种新的转换函数,称为逆S型转换函数。这种转换函数能够更有效地将连续空间映射到二进制空间,从而提升算法的搜索效率。此外,为了更好地平衡探索与利用的能力,DEBPSO还设计了一种新的游戏机制。该机制通过模拟游戏过程中的策略调整,引导粒子在特征空间中更全面地搜索,避免过早收敛于局部最优解。

为了验证DEBPSO的性能,本文在27个著名的数据集上进行了全面的实验。这些数据集来源于UCI机器学习仓库和医学网站,涵盖了不同领域的数据,特征数量从4到10000不等,样本数量从32到5473不等。实验结果表明,在大多数数据集中,DEBPSO的分类错误率显著优于其他对比算法,显示出其在降低分类错误率和去除无关特征方面的高效性。

在实验设置中,首先将DEBPSO与其他几种常见的二进制PSO变体进行了比较,包括采用不同转换函数的BPSO算法。随后,DEBPSO还与四种经典二进制元启发式算法(如BPSO、BDE、BEO和BGWO)以及五种近期提出的算法进行了对比。实验结果表明,DEBPSO在分类错误率、特征数量和适应度等方面均表现优异,特别是在处理大规模数据集时,其优势更加明显。

总体而言,本文的研究成果具有以下几个方面的重要贡献:首先,提出了一种新的二进制粒子群优化算法,结合了转换函数和布尔编码机制,以解决特征选择问题;其次,设计了一种逆S型转换函数,提高了算法在二进制搜索空间中的探索能力;第三,引入了一种新的游戏机制,以平衡算法的探索与利用能力;最后,通过在27个数据集上的实验验证,展示了DEBPSO在实际应用中的优越性能。

在研究过程中,作者们充分考虑了不同数据集的特点,以确保实验的全面性和代表性。同时,实验设计涵盖了多种评价指标,包括分类错误率、特征数量和适应度,以全面评估算法的性能。这些实验不仅验证了DEBPSO的有效性,也为未来的研究提供了有价值的参考。

此外,本文还对现有的特征选择方法进行了系统回顾,分析了不同方法的优缺点,并指出了当前研究中存在的不足。例如,传统的转换函数在处理二进制优化问题时可能表现出一定的局限性,而布尔编码机制虽然能够自然处理二进制搜索空间,但在某些情况下可能无法充分发挥其潜力。因此,本文提出的DEBPSO算法试图通过结合两种不同的编码机制,弥补现有方法的不足,提高算法的整体性能。

在算法实现过程中,作者们还考虑了如何优化粒子的更新规则和搜索策略。通过引入逆S型转换函数,粒子能够在二进制空间中更灵活地调整其位置,从而避免陷入局部最优。同时,游戏机制的引入使得粒子在搜索过程中能够动态调整其行为,以适应不同的数据集和问题需求。这种机制不仅提高了算法的鲁棒性,还增强了其在复杂数据环境中的适应能力。

实验结果显示,DEBPSO在多个数据集上的表现均优于其他对比算法。这表明,该算法在处理特征选择问题时具有较强的通用性和适应性。特别是在处理高维数据集时,DEBPSO能够更有效地去除冗余和无关特征,从而提升分类模型的性能。此外,实验还表明,DEBPSO在保持较低特征数量的同时,能够实现较高的分类准确率,这对于实际应用中的资源限制和模型效率具有重要意义。

综上所述,本文提出了一种新的二进制粒子群优化算法,结合了转换函数和布尔编码机制,以解决特征选择问题。通过引入逆S型转换函数和游戏机制,该算法在探索与利用之间取得了更好的平衡,从而提升了其在二进制搜索空间中的性能。实验结果表明,DEBPSO在多个数据集上的表现优于现有算法,具有广泛的应用前景。未来的研究可以进一步探索该算法在不同应用场景中的优化潜力,以及如何与其他机器学习方法相结合,以实现更高效的特征选择和模型训练。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号