一种基于深度学习的代码相似度检测方法

正文

推荐专利

一种基于深度学习的代码相似度检测方法

申请号：CN202510393968

申请日期：2025-03-31

公开号：CN120336871B

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开的属于代码相似度检测技术领域，具体为一种基于深度学习的代码相似度检测方法，包括具体步骤如下：收集代码，对代码进行预处理，其操作包括删除相应的注释内容、对变量名和函数名进行规范化处理、代码格式统一，将处理以后的代码进行任意的两两组合以及代码相似度评级得到一个三元组<代码A，代码B，相似度y>，所有三元组的集合构成一个代码数据集。本发明通过计算代码语法和语义特征的相似度来评估代码整体的相似度；在提取代码语法特征向量方面，在对语法树中每一个节点进行特征聚合时，考虑了该节点所处深度以及其兄弟节点的特征，避免了常规方法对树形结构进行聚合时的特征丢失。

技术关键词

度检测方法语法特征矩阵 GCN模型语义特征序列三元组生成代码语义向量网络度检测技术多尺度信息邻居树形结构节点特征注意力机制输出特征

一种基于深度学习的代码相似度检测方法

站点导航

APP 下载