
-
生物通官微
陪你抓住生命科技
跳动的脉搏
DP-S3:通过结合语法树、程序切片和标准特征进行特征融合来实现软件缺陷预测
《The Computer Journal》:DP-S3: software defect prediction through feature fusion with syntax trees, program slices and standard features
【字体: 大 中 小 】 时间:2025年11月07日 来源:The Computer Journal
编辑推荐:
软件缺陷预测方法DP-S3融合抽象语法树、程序切片和标准代码指标,采用通道自注意力机制动态融合多源特征,在7个Java项目中验证优于基线方法,平均AUC提升3.8%,F1提升4.5%,MATCC提升7.5%。
软件缺陷预测(SDP)对于提高软件质量和降低开发成本至关重要。现有的SDP方法通常依赖于传统的代码指标,但这些指标无法充分捕捉源代码中的关键语义信息,从而限制了缺陷识别的准确性。本文介绍了一种名为DP-S3的新SDP模型,该模型整合了抽象语法树(AST)、程序切片和标准指标的特征。DP-S3首先提取AST和程序切片,并将它们转换为向量表示形式。随后,一个分层的长短期记忆网络从这些向量中学习语义特征,并将这些特征与PROMISE仓库中的标准指标相结合。我们的一个关键创新点在于采用了通道自注意力机制来动态加权这三个特征集。我们在Apache仓库中的七个开源Java项目上对DP-S3进行了评估,并与几种最先进的方法进行了比较。结果表明,DP-S3的性能更为优越,在接收者操作特征曲线下面积(AUC)上平均提高了3.8%,在F1分数上提高了4.5%,在马修斯相关系数上提高了7.5%,充分证明了其有效性。尽管目前DP-S3主要针对Java项目及其内部缺陷预测,但其优势仍然显著。总体而言,这项工作表明,通过注意力机制引导的句法特征、语义特征(基于切片)和传统指标特征的协同融合能够显著提升SDP的能力,为未来的研究指明了方向。
生物通微信公众号
知名企业招聘