一种大语言模型语料构建方法、系统、电子设备及存储介质

AITNT
正文
推荐专利
一种大语言模型语料构建方法、系统、电子设备及存储介质
申请号:CN202411661295
申请日期:2024-11-20
公开号:CN119520103A
公开日期:2025-02-25
类型:发明专利
摘要
本发明公开了一种大语言模型语料构建方法、系统、电子设备及存储介质,包括:基于初始设定的网络安全任务种子池,通过第一大语言模型判别新生成的指令是否为分类任务指令,若不是分类任务指令,则为非分类任务指令;将分类任务指令按照输入优先的方式输入第一大语言模型,生成输入输出对,形成分类任务语料集;将非分类任务指令按照输出优先的方式输入第一大语言模型,生成输入输出对,形成非分类任务语料集;合并分类任务语料集和非分类任务语料集,过滤低质量和重复指令,形成网络安全领域大语言模型指令精调语料集。本发明能够丰富指令精调样本的多样性,从而进一步提升网络安全大模型在指令精调阶段的性能。
技术关键词
大语言模型 语料构建方法 指令 种子 安全事件信息 日志 电子设备 模板 判别模块 构建系统 安全设备 采样模块 程序 数据 可读存储介质 处理器 组织 入口 漏洞
系统为您推荐了相关专利信息
1
基于动态优先级冲突搜索算法的燃料运输筹措系统及方法
运输车辆 节点 任务分配算法 搜索算法 燃料
2
一种基于客户数据的营销策略处理方法及装置
多媒体 客户 机器学习算法 策略 深度学习模型
3
一种基于防洪大模型的水文模型耦合方法
水文模型 耦合方法 知识图谱构建 河道洪水演算 水利
4
一种支持MCP协议的大语言模型驱动型FMT自动建模方法
自动建模方法 大语言模型 自然语言 协议 人工智能控制系统
5
基于脉冲热效应的土壤热传导参数快速测量方法及系统
数值仿真模型 热传导 测量方法 地热 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号