摘要
本申请提供了基于强化学习的智能漏洞扫描策略生成方法及装置。本实施例通过强化学习基于实时感知的目标设备的设备特征向量、以及目标设备的历史扫描结果,动态生成当前的扫描插件选择策略,以保证动态生成的扫描插件选择策略具有较强的动态适应能力,从而减少误报和漏报。进一步地,本实施例借助于强化学习的奖励机制,根据不同扫描插件的历史表现和目标设备当前的扫描结果(甚至再加上用户反馈信息),实时优化调整强化学习模型中的Actor模型,以实现不断优化后续的扫描插件选择策略,提升检测效率和准确性。
技术关键词
插件
强化学习模型
Actor模型
识别异常信息
画像
操作系统
设备固件版本信息
贪心策略
扫描策略
数据
生成方法
编码
端口
调度算法
风险
扫描装置
词嵌入向量
LSTM模型
系统为您推荐了相关专利信息
间歇反应釜
智能控制方法
递归最小二乘法
多模型
强化学习模型
兴趣
上下文特征
数据处理方法
推荐算法
注意力机制