摘要
本发明提供了一种网络安全指令微调数据集的高效构建方法,包括对网络安全领域的相关知识进行主题分类;针对每一主题,利用GPT大模型批量生成网络安全指令;根据指令回复生成模板,循环调用GPT大模型生成响应的指令回复;将生成的网络安全指令、响应的指令回复转换为预设格式的网络安全指令数据;对网络安全指令数据进行质量审查,剔除不合格的指令数据,并重新生成指令回复与构建指令数据,直至该主题的指令数据的数量达到设定值;将所有主题的网络安全指令数据汇总,形成完备的网络安全指令微调数据集。本发明能够在耗费较短时间、较低成本的情况下,构建网络安全指令微调数据集,支撑网络安全垂直领域大模型的快速构建和应用落地。
技术关键词
高效构建方法
数据
生成模板
生成指令
训练语言模型
批量
计算机程序指令
生成主题
格式
处理器
可读存储介质
存储器
短时间
低成本
文本
系统为您推荐了相关专利信息
散料装车
定量装车
LSTM模型
静态特征
管道横截面积
路由器
智能数据处理
网络管理方法
样本
比例分配公式