CCCS:利用代码图信息进行对比性跨语言代码搜索

《ACM Transactions on Asian and Low-Resource Language Information Processing》:CCCS: Contrastive Cross-Language Code Search Using Code Graph Information

【字体: 时间:2025年11月08日 来源:ACM Transactions on Asian and Low-Resource Language Information Processing

编辑推荐:

  本文提出一种基于对比学习的跨语言代码搜索方法(CCCS),通过CodeBERT提取代码序列特征,结合图卷积神经网络捕获结构特征,优化跨语言代码片段的向量表示,实验表明其MRR指标显著优于现有基线模型。

  

摘要

在软件开发过程中,开发人员经常搜索和重用现有的代码片段以提高开发效率。目前,研究人员已经提出了许多代码搜索方法。然而,这些方法的搜索意图基本上是基于自然语言的查询。为了支持代码迁移和代码重构,需要将一种编程语言的代码片段与另一种编程语言的代码片段进行匹配。在本文中,我们提出了一种利用代码图信息的跨语言代码搜索方法,称为CCCS。该方法首先使用预训练的CodeBERT将代码片段转换为高维向量,以提取代码片段的序列特征;接着利用图卷积神经网络提取代码片段的结构特征;最后通过对比学习方法对模型进行训练,优化跨语言代码片段的向量表示,使模型能够区分具有相同功能的不同编程语言的代码片段。为了评估我们方法的有效性,我们分别在小型数据集和大型数据集上进行了对比实验和消融实验。实验结果表明,我们的方法在MRR指标上远优于现有的最佳基线模型。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号