摘要
本说明书实施例提供了一种基于深度强化学习的智能渗透测试方法及装置,其中,方法包括:构建网络信息环境并设置基本参数,对网络信息环境进行初始化,构建具有独立的策略网络和价值网络的actor‑critic结构;将渗透测试的马尔可夫决策过程建模为一个四元组<S,A,R,P>,构建马尔可夫模型;构建优先级回放经验池;基于马尔可夫模型进行渗透测试,通过策略网络基于当前渗透状态,计算并输出攻击动作给网络信息环境得到下一渗透状态,通过价值网络对攻击动作进行奖励,将数据保存在优先级回放经验池,计算并根据经验的优先级确定优先选择抽样的方式,重复上述马尔可夫模型的渗透测试操作,直到函数收敛,输出最优渗透策略。
技术关键词
马尔可夫模型
渗透测试方法
深度强化学习
生成测试用例
概率密度函数
渗透测试装置
主机操作系统
节点
防火墙配置
可读存储介质
报告
策略更新
处理器
决策
网络拓扑
校正
测试模块
数据
系统为您推荐了相关专利信息
健康状态评估方法
模式
Copula函数
因子
随机森林模型
网络安全事件
时序特征
隐马尔可夫模型
网络流量数据
意图
资源分配
卸载方法
混合整数非线性规划
状态下多用户设备
凸优化方法
医学图像分割方法
图像块
医学图像数据
编码器
特征提取网络
网络性能数据
数据分配策略
低轨道卫星网络
链路数据传输方法
性能预测模型