摘要
本发明公开了一种思维链数据集的生成方法、装置、设备及存储介质,该方法采用大语言模型基于第一预设提示词集合对攻击样本数据进行处理,得到初始推理结果;将初始推理结果与预设标注结果进行对比得到第一比较结果;在第一比较结果一致时,基于初始推理结果得到标准化思维链;在第一比较结果不一致时,基于目标修正推理结果得到标准化思维链,其中,目标修正推理结果是基于第二预设提示词集合得到的;在思维链数据集中加入标准化思维链。也就是说,本申请采用大语言模型基于第一预设提示词集合和第二预设提示词集合对攻击样本数据进行处理,得到包含攻击行为和攻击过程的网络安全数据集,进而为安全大模型的训练提供更高质量的训练集。
技术关键词
大语言模型
样本
生成方法
动态时间规整算法
关联分析算法
重命名方法
网络安全数据
时间同步协议
去重算法
存储程序指令
可读存储介质
格式
框架
生成装置
自然语言
语义
模块
存储器
计算机
系统为您推荐了相关专利信息
云资源管理
资源管理方法
资源管理策略
脚本
多云环境
深度强化学习模型
压缩特征
特征提取网络
锁组
矩阵
特征提取模型
样本
内容检测方法
特征提取器
计算机执行指令
眼肌面积
深度学习技术
图像采集系统
数字图像采集设备
深度学习模型