学习软件缺陷报告:一项系统性文献综述

《ACM Transactions on Software Engineering and Methodology》:Learning Software Bug Reports: A Systematic Literature Review

【字体: 时间:2025年11月10日 来源:ACM Transactions on Software Engineering and Methodology

编辑推荐:

  Bug报告分析领域的机器学习研究进展及未来方向

  

摘要

近年来,人工智能尤其是机器学习(ML)在各个软件工程研究领域取得了显著进展。其中,错误报告分析就是一个典型的例子,它旨在利用机器学习方法自动理解、提取并关联报告中的信息。尽管机器学习在自动化和提升错误报告分析方面发挥着重要作用,但迄今为止仍缺乏系统性地审视该领域最新进展的综合性综述。在本文中,我们对这一具有前景的研究主题进行了系统的文献回顾。我们共查阅了1,825篇论文,并从中筛选出204篇最具代表性的研究进行详细分析。基于这些研究中的统计数据和趋势,我们得出了以下七个关键发现:1) 卷积神经网络(CNN)、长短期记忆网络(LSTM)和K近邻(KNN)在错误报告分析中被广泛使用,但更先进的模型(如BERT)由于复杂性和计算要求较高而未能得到充分应用;2) Word2Vec和TF-IDF是最常见的特征表示方法,近年来基于深度学习的方法使用频率有所增加;3) 停用词去除是最常见的预处理方法,其次是分词和词干提取;4) Eclipse和Mozilla是最常被评估的软件项目,这反映了它们在该领域的重要性;5> 错误分类是最受欢迎的任务,其次是错误定位、任务分配以及严重性/优先级预测;随着自然语言处理(NLP)技术的进步,人们对错误报告摘要的兴趣也在不断增加;6) 大多数研究关注通用类型的错误,但对非功能性错误和性能错误的关注度也在提升;7> 常见的评估指标包括F1分数、召回率、精确度和准确率,但与错误报告相关的评估指标尚未受到足够重视;8) 大多数研究倾向于使用k折交叉验证(k-fold cross-validation)来评估模型性能;最后,基于这些关键发现,我们提出了六个有前景的未来研究方向,希望通过这些方向的研究成果为该领域的实践者提供有价值的见解。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号