基于图采样聚合注意力网络与游牧优化器的软件缺陷预测模型提升软件可靠性研究

【字体: 时间:2025年06月04日 来源:Computer Standards & Interfaces 4.1

编辑推荐:

  针对软件缺陷预测(SDP)中类别不平衡和特征选择难题,研究人员提出graphSAGE-NPO-SDP模型,集成图采样聚合网络(graphSAGE)与游牧优化器(NPO),通过Promise Repository数据集验证,准确率提升最高达36.48%,为软件质量保障提供新范式。

  

在当今数字化浪潮中,软件质量直接关系到社会各领域的运行效率与安全性。然而,传统软件缺陷预测(SDP)方法面临两大核心挑战:一是代码库中缺陷样本与非缺陷样本的极端不平衡分布,二是高维特征空间中有效信息的提取难题。这些问题导致现有模型如基于复杂度的过采样技术(COT-ACI-SDP)、多层感知器(MLP-SDP)等预测准确率难以突破30%的瓶颈。更棘手的是,随着现代软件系统复杂度呈指数级增长,传统统计模型和浅层机器学习算法已无法捕捉代码中的深层拓扑关联。

为此,来自中国的研究团队Dr. P Dhavakumar等创新性地将图神经网络与群体智能优化相结合,提出graphSAGE-NPO-SDP框架。该研究通过Promise Repository标准数据集验证,最终在《Computer Standards》发表的研究成果显示,新模型相较现有最佳方法最高提升36.48%的准确率,同时将F-measure和特异性分别优化28%以上。这项突破不仅为软件工程领域提供了可解释性更强的缺陷定位工具,更开创了将群体智能算法应用于图神经网络参数优化的新范式。

研究团队采用三大关键技术:首先从Promise Repository获取跨版本软件度量数据,经Min-Max Scaling标准化处理;随后采用Univariate Ensemble特征选择技术(UEFST)降维;最终构建的graphSAGE网络通过游牧优化器(NPO)动态调整聚合权重。这种技术路线既保留了代码调用图的拓扑特征,又通过NPO的迁徙-探索机制避免了传统梯度下降的局部最优陷阱。

Results and Discussion
仿真实验表明,在MATLAB环境下,graphSAGE-NPO-SDP的准确率达到32.45%-36.48%的突破性提升。特别在敏感性指标上,对少数类(缺陷样本)的识别率显著优于对比模型,证明NPO优化有效缓解了类别不平衡问题。执行时间分析显示,UEFST特征选择使模型推理效率提升40%,满足工业级实时检测需求。

Discussion
研究团队指出,传统SDP方法如DNN-GA-SDP依赖遗传算法(GA)的随机搜索,而graphSAGE-NPO-SDP通过模拟游牧民族"逐水草而居"的NPO机制,实现了参数空间的定向探索。这种生物启发式优化使模型在RMSE(均方根误差)指标上降低21.7%,证实其在复杂软件系统中的稳定性和泛化能力。

Conclusion
该研究证实,融合图神经网络与群体智能的跨学科方法能显著提升SDP性能。graphSAGE-NPO-SDP框架的创新性体现在:1) 通过graphSAGE捕捉代码模块间的拓扑依赖;2) 利用NPO解决神经网络超参数优化难题;3) UEFST特征选择保障模型可解释性。这些发现为构建下一代智能软件质量保障体系提供了理论基础和技术支撑,对降低软件维护成本、提升关键系统可靠性具有重要实践价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号