摘要
本申请公开了一种代码克隆检测方法、装置、设备、介质及产品,涉及深度学习技术领域,该方法包括获取待检测代码库;其中,待检测代码库中包含多个待检测代码片段;确定每个待检测代码片段的哈希值;基于每个待检测代码片段的哈希值,确定高相似度代码片段对集合;其中,高相似度代码片段对集合中包含至少一组高相似度代码片段对;将高相似度代码片段对集合输入至预先训练的基于大语言模型的代码克隆检测模型,得到代码克隆检测模型输出的代码克隆检测结果,本申请可以充分利用大语言模型的能力,避免模型对代码语法表面特征的过度依赖,进而基于对代码片段的语义分析实现对代码功能相似性的准确判断,从而可以提升代码克隆检测的准确性。
技术关键词
代码克隆检测方法
大语言模型
摘要
数据
语义
标签
代码库
深度学习技术
处理器
计算机程序产品
计算机设备
可读存储介质
存储器
指令
参数
系统为您推荐了相关专利信息
永磁操动机构
智能诊断系统
实时数据监测
电流
符号
飞行器
异常检测方法
聚类
飞行安全监控
DBSCAN算法