摘要
本申请提供一种AI代码缺陷修复数据集构建方法、缺陷修复方法及设备。数据集构建方法,包括:获取多组初始AI代码数据;每组初始AI代码数据分别包括缺陷数据和对应的修复数据;对多组初始AI代码数据进行变异处理;每组变异AI代码数据包括变异缺陷数据和对应的变异修复数据;对多组初始AI代码数据和多组变异AI代码数据分别进行去重和上下文提取处理,得到多组AI代码片段;依据CWE标准对多组AI代码片段进行分类和标注,得到多组结构化的AI代码片段;对多组结构化的AI代码片段进行预处理,以使多组结构化的AI代码数据对应的数据格式一致;将预处理后的每组结构化的AI代码片段,分别生成思维链数据,得到AI代码数据集。
技术关键词
数据集构建方法
代码缺陷
缺陷修复方法
计算机程序指令
漏洞
数据格式
计算机程序产品
处理器
语义
符号
存储器
标记
电子设备
内存
文本
标签
系统为您推荐了相关专利信息
自动语音识别方法
识别模块
计算机程序指令
文本
数据
变压器噪声控制
温度预测模型
周期性
散热系统
计算机程序指令
训练智能体
强化学习算法
智能体训练方法
增强子
基线
安防报警系统
安防报警模块
智能分析模块
异常数据
卷积神经网络算法