一种大语言模型语料构建方法、系统、电子设备及存储介质

正文

推荐专利

申请号：CN202411661295

申请日期：2024-11-20

公开号：CN119520103A

公开日期：2025-02-25

类型：发明专利

摘要

本发明公开了一种大语言模型语料构建方法、系统、电子设备及存储介质，包括：基于初始设定的网络安全任务种子池，通过第一大语言模型判别新生成的指令是否为分类任务指令，若不是分类任务指令，则为非分类任务指令；将分类任务指令按照输入优先的方式输入第一大语言模型，生成输入输出对，形成分类任务语料集；将非分类任务指令按照输出优先的方式输入第一大语言模型，生成输入输出对，形成非分类任务语料集；合并分类任务语料集和非分类任务语料集，过滤低质量和重复指令，形成网络安全领域大语言模型指令精调语料集。本发明能够丰富指令精调样本的多样性，从而进一步提升网络安全大模型在指令精调阶段的性能。

技术关键词

大语言模型语料构建方法指令种子安全事件信息日志电子设备模板判别模块构建系统安全设备采样模块程序数据可读存储介质处理器组织入口漏洞

系统为您推荐了相关专利信息

基于动态优先级冲突搜索算法的燃料运输筹措系统及方法

运输车辆节点任务分配算法搜索算法燃料

一种基于客户数据的营销策略处理方法及装置

多媒体客户机器学习算法策略深度学习模型

一种基于防洪大模型的水文模型耦合方法

水文模型耦合方法知识图谱构建河道洪水演算水利

一种支持MCP协议的大语言模型驱动型FMT自动建模方法

自动建模方法大语言模型自然语言协议人工智能控制系统

基于脉冲热效应的土壤热传导参数快速测量方法及系统

数值仿真模型热传导测量方法地热参数

一种大语言模型语料构建方法、系统、电子设备及存储介质

站点导航

APP 下载