摘要
本发明提出了一种基于大语言模型和强化学习的威胁狩猎方法,属于网络安全技术领域。首先从威胁情报中提取初始威胁实体,形成初始威胁节点集合,并构建向量‑文本检索数据库;而后通过强化学习算法从当前威胁节点集合中选择最优威胁节点,结合大语言模型、向量‑文本检索数据库,根据冷启动策略或上置信界的变体策略选择出最优威胁狩猎方法,解决了威胁狩猎冷启动阶段知识稀缺的问题;最后通过递归更新节点质量、基于相似度更新方法质量的方式,解决了威胁节点选择与威胁狩猎方法选择过程中存在的稀疏奖励问题。本发明解决了现有技术在威胁狩猎场景下收敛速度慢、冷启动困难的问题,实现了智能化、高效率的威胁狩猎。
技术关键词
狩猎方法
大语言模型
节点
强化学习算法
冷启动策略
更新方法
阶段
冷启动方法
词嵌入模型
文本
网络安全技术
矩阵
度量
实体
代表
高效率
元素
场景
参数