摘要
本发明属于强化学习和渗透测试技术领域,本发明公开了一种分布式多智能体网络渗透方法、装置及存储介质,将处于同一个网段上但特征信息不同的主机划分成不同的子网;在基于分布式因果强化学习的攻击路径发现任务中,在各自的子网域分别放置一个智能体进行节点扫描,将扫描的信息输入到时序卷积因果模型中,输出表示漏洞类型的时空特征信息;聚合网络状态信息,得到主机状态序列;向每个智能体输入所述主机状态序列,以使智能体基于所述主机状态序列执行一系列动作获取并共享每个智能体的渗透经验,迭代直至因果强化学习模型收敛,得到训练好的因果强化学习模型。优点:使得智能体状态、动作空间爆炸等问题得到有效缓解,加快训练效率。
技术关键词
分布式多智能体
时空特征信息
强化学习模型
网络状态信息
时序结构
序列
网络中心
漏洞
渗透测试技术
随机游走方法
更新网络参数
主机特征
编码器参数
记忆
解码器
系统为您推荐了相关专利信息
翅片式冷凝器
消毒系统
制氧装置
强化学习模型
臭氧发生器
预警方法
深度强化学习模型
时序分析模块
动态
点云数据采集
采集传输方法
飞行模拟机
菊花链式
双核处理器
航空电子系统
智慧物联网
数据接入方法
语义本体
协议
深度强化学习模型
动态参数模型
收集机器人
实时数据
强化学习模型
关键控制参数