摘要
一种基于多智能体强化学习的5G‑IoT网络最优路径渗透方法,步骤包括:构建面向5G‑IoT网络场景的攻击图;然后在攻击图中规划最优渗透路径。攻击图中各个状态节点表示网络中的设备;状态节点之间的有向边表示节点之间的状态转移,有向边上标注了相应的漏洞得分;最优渗透路径是在攻击图中的起始节点和目标节点之间的攻击获益最大的路径;攻击获益的衡量指标包括漏洞得分和攻击持续时间。采用基于多智能体深度确定性策略梯度算法的协同渗透模型规划渗透路径;协同渗透模型采用中心化训练‑去中心化决策的MARL架构作为基础模型;协同渗透模型的输入包括当前网络环境参数和攻击图信息,输出是当前网络环境下的最优任务调度策略,即最优渗透路径。
技术关键词
多智能体强化学习
中央控制器
任务调度策略
漏洞
节点
渗透测试系统
网络拓扑
任务分配方法
样本
更新网络参数
发布者
决策
规划
算法
计算方法
代表
网络部署
系统为您推荐了相关专利信息
分布式光伏阵列
预测发电功率
模型建立方法
节点
负荷
安全策略分发
网络设备
节点
网络安全事件
管理方法
进化方法
蒙特卡洛树搜索
搜索算法
预训练模型
逻辑