摘要
本发明公开了一种大语言模型语料构建方法、系统、电子设备及存储介质,包括:基于初始设定的网络安全任务种子池,通过第一大语言模型判别新生成的指令是否为分类任务指令,若不是分类任务指令,则为非分类任务指令;将分类任务指令按照输入优先的方式输入第一大语言模型,生成输入输出对,形成分类任务语料集;将非分类任务指令按照输出优先的方式输入第一大语言模型,生成输入输出对,形成非分类任务语料集;合并分类任务语料集和非分类任务语料集,过滤低质量和重复指令,形成网络安全领域大语言模型指令精调语料集。本发明能够丰富指令精调样本的多样性,从而进一步提升网络安全大模型在指令精调阶段的性能。
技术关键词
大语言模型
语料构建方法
指令
种子
安全事件信息
日志
电子设备
模板
判别模块
构建系统
安全设备
采样模块
程序
数据
可读存储介质
处理器
组织
入口
漏洞
系统为您推荐了相关专利信息
水文模型
耦合方法
知识图谱构建
河道洪水演算
水利
自动建模方法
大语言模型
自然语言
协议
人工智能控制系统