摘要
本发明公开了一种基于多级预测的代码克隆克隆检测方法、装置及介质,所述方法包括:首先对代码片段进行抽象语法树AST解析并通过遍历生成AST节点编码序列,同时,将代码文本转化为Token序列,通过相似结构的深度学习模型分别从AST节点序列和Token序列中提取特征向量,并基于AST编码序列得到节点类型统计向量,最后进行多级预测:根据得到的代码的抽象语法树特征、文本特征、节点类型特征依次对代码对进行相似性计算,仅当所有级别的预测均确认克隆存在时,才最终判定代码对为克隆对。本发明通过多级预测机制,从多维度分析代码的特征以提高克隆检测的准确性,为代码克隆检测提供了一种高效且可靠的方法。
技术关键词
代码克隆检测方法
双向长短期记忆网络
抽象语法树
文本
节点
词嵌入方法
语义特征提取
深度学习模型
序列
度量
处理器
多阶段
电子装置
存储器
编码
介质
冗余
系统为您推荐了相关专利信息
融合情感特征
注意力机制
问答方法
标签
对话策略
节点特征
分类预测模型
多层感知机
分类方法
蒸馏
辩识方法
列车控制系统
三元组
融合上下文信息
实体
电磁干扰数据
电磁屏蔽结构
屏蔽效能
深度优先遍历
集成电路芯片