摘要
本发明公开了一种基于深度语义表征的编译器重复缺陷识别方法,S1、利用辅助分类任务微调预训练代码表征模型,利用中间表示学习去学习与测试失败相关的致错语义信息;S2、从微调后的所述预训练代码表征模型提取致错语义表征向量;S3、利用所述致错语义表征向量计算各个致错程序之间的距离,得到致错程序之间的致错距离矩阵;以所述致错距离矩阵为依据进行致错程序的优先级排序,优先访问最远位置的编译器缺陷,以实现编译器代码的重复缺陷识别。本发明提高了黑盒方式编译器缺陷重复缺陷识别的效率与效果。
技术关键词
重复缺陷
识别方法
语义
程序
矩阵
标识符
编码器
算法
语句
列表
线性
数据
系统为您推荐了相关专利信息
蒙特卡洛树搜索
节点
矩阵
训练卷积神经网络
策略
空间多尺度
多尺度信息
注意力
Softmax函数
通道
索引推荐方法
抽象语法树
查询意图
性能指标数据
文本