摘要
本申请公开了一种基于大模型的同源代码检测方法、装置、设备及介质,涉及人工智能技术领域,包括:利用目标智能体对初始参考代码进行预处理得到目标参考代码;确定目标参考代码的第一代码特征和第一功能信息,并将第一代码特征和第一功能信息存储至与目标参考代码功能对应的数据库中;利用目标智能体对初始待检测代码进行预处理得到目标待检测代码;确定目标待检测代码的第二代码特征和第二功能信息,并从数据库中确定与目标待检测代码功能对应的目标数据库;确定第二代码特征与目标数据库中第一代码特征的对比结果,并基于对比结果、第二功能信息和目标数据库中第一功能信息检测目标待检测代码的同源代码。本申请可以高效、准确的检测同源代码。
技术关键词
代码特征
源代码检测方法
抽象语法树
数据流特征
函数调用关系
语法分析器
指纹
信息存储模块
存储计算机程序
人工智能技术
变量
电子设备
处理器
可读存储介质
存储器
系统为您推荐了相关专利信息
自定义脚本
错误传播分析
语法结构
抽象语法树
可视化界面
节点特征
性能预测方法
链路
性能预测模型
消息更新
数据处理引擎
可视化组件
非易失性计算机可读存储介质
服务器
并行计算单元
语义特征
深度学习模型
训练机器学习模型
代码特征
代码抄袭检测