基于大语言模型的漏洞信息识别方法及装置

正文

推荐专利

基于大语言模型的漏洞信息识别方法及装置

申请号：CN202411966797

申请日期：2024-12-30

公开号：CN119783116A

公开日期：2025-04-08

类型：发明专利

摘要

本公开属于核电技术领域，具体涉及一种基于大语言模型的漏洞信息识别方法及装置。本公开针对某些CVE的PoC信息进行收集，并对部分数据进行人工标注，以人工标注的方式增强了训练数据的准确可靠性，从而提高后续模型的学习能力。通过利用GPT‑3.5‑turbo模型对CVE和PoC数据进行识别和总结，基于TTP内容形式对每条信息进行描述，将CVE和PoC信息统一为TTP标准格式，剔除了原始信息中的噪音干扰，能够增强大语言模型对关键信息特征的识别和学习能力，并使用指令微调技术提高GPT模型完成任务效果。基于微调完成后的Llama‑2模型，对输入的目标CVE和PoC信息进行识别处理，并基于输出判别CVE和PoC的关联关系。从而解决CVE与PoC关联识别时依赖人工分析的问题。

技术关键词

大语言模型信息识别方法样本信息识别装置非易失性计算机可读存储介质计算机程序指令自然语言信息漏洞关系带标签数据收集模块翻译语言微调技术指数核电技术数据处理模块处理器

系统为您推荐了相关专利信息

一种湖泊COD反演方法

反演模型非线性特征反演方法卷积模块样本

信息处理方法、装置、存储介质及电子设备

意图策略编码信息处理方法大语言模型

一种非结构化数据动态抽样存储方法和装置

数据存储对象抽样算法块加密算法数据存储结构强度

一种面向目标领域的大语言模型训练方法及装置

大语言模型语言模型训练方法超参数插件分词

通信投诉处理方法、装置、电子设备以及存储介质

故障特征信息网络状态信息基站情绪状态信息指标

基于大语言模型的漏洞信息识别方法及装置

站点导航

APP 下载