
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于自适应邻域粗糙集与混合正弦余弦优化的双相特征选择方法在复杂分类任务中的应用研究
【字体: 大 中 小 】 时间:2025年08月09日 来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
这篇研究提出了一种创新的双相特征选择方法(ARSHF),通过自适应邻域粗糙集(NRS)横向筛选特征,结合混合正弦余弦算法(HSCA)纵向优化样本,显著提升了高维/多类/不平衡数据集(如医疗和金融领域)的分类性能。实验证明其准确率、加权F1值等指标均超越7种基准算法(Wilcoxon检验p<0.05)。
亮点
本研究开创性地将自适应邻域粗糙集与混合正弦余弦算法结合,通过双相(横向特征选择+纵向样本优化)处理机制,攻克了高维不平衡数据分类的核心难题。参数δ(邻域半径)和λ(包含度)的动态调整策略,使模型能像"智能显微镜"般自适应不同数据粒度。
自适应邻域粗糙集特征选择
在第一阶段横向处理中,我们构建了基于k折交叉验证的自适应NRS模型。通过动态优化δ和λ这对"黄金参数",系统筛选出最具判别力的特征子集。实验显示,该方法在医疗影像数据集上特征维度降低72%时仍保持94%分类准确率。
混合正弦余弦算法优化
第二阶段引入增强型SCA算法,其独特的反向学习机制像"分子剪刀"精准剪除噪声样本。在乳腺癌基因数据集测试中,该步骤使少数类样本识别率提升19.8%,显著缓解了类别不平衡问题。
实验与分析
跨越21个数据集(含8个医疗数据集)的测试表明,ARSHF框架的加权F1值平均提高6.3%。特别是在阿尔茨海默症MRI数据分类中,其准确率(89.7%)显著优于传统方法(p=0.0032)。
结论
这项研究为复杂生物医学数据分类提供了新范式。就像为数据安装了"双焦点透镜",既能宏观把握特征关联,又能微观剔除样本噪声。未来可拓展至单细胞测序等更高维生物数据场景。
作者贡献声明
郑成锋:核心算法开发;Mohd Shareduwan:实验验证;颜志忠:理论指导;Mansor:数据 curation;高远:生物医学应用适配;陈菊:方法论优化。
利益声明
全体作者声明无潜在利益冲突。
致谢
感谢马来西亚理科大学(USM)短期基金(304/PMATHS/6315655)和中国国家自然科学基金(11372039)的资助。
生物通微信公众号
知名企业招聘