
-
生物通官微
陪你抓住生命科技
跳动的脉搏
CCCS:利用代码图信息进行对比性跨语言代码搜索
《ACM Transactions on Asian and Low-Resource Language Information Processing》:CCCS: Contrastive Cross-Language Code Search Using Code Graph Information
【字体: 大 中 小 】 时间:2025年11月08日 来源:ACM Transactions on Asian and Low-Resource Language Information Processing
编辑推荐:
本文提出一种基于对比学习的跨语言代码搜索方法(CCCS),通过CodeBERT提取代码序列特征,结合图卷积神经网络捕获结构特征,优化跨语言代码片段的向量表示,实验表明其MRR指标显著优于现有基线模型。
CCCS。该方法首先使用预训练的CodeBERT将代码片段转换为高维向量,以提取代码片段的序列特征;接着利用图卷积神经网络提取代码片段的结构特征;最后通过对比学习方法对模型进行训练,优化跨语言代码片段的向量表示,使模型能够区分具有相同功能的不同编程语言的代码片段。为了评估我们方法的有效性,我们分别在小型数据集和大型数据集上进行了对比实验和消融实验。实验结果表明,我们的方法在MRR指标上远优于现有的最佳基线模型。
生物通微信公众号
知名企业招聘