摘要
本发明属于网络安全保护技术领域,其目的在于提供一种基于强化学习的动态防御方法、系统、设备及介质。其中的方法包括:采集目标网络多个历史时刻的状态特征信息及防御动作,并根据多个历史时刻的状态特征信息得到状态集合,根据多个历史时刻的防御动作得到动作集合;基于状态集合和动作集合,得到初始攻击样本;采用生成对抗网络基于初始攻击样本生成对抗攻击样本;构建初始智能体,并采用初始攻击样本和对抗攻击样本对初始智能体进行训练,使其学习到最优防御策略,进而得到训练后智能体;将训练后智能体部署至目标网络中,以便实现对目标网络的动态防御。本发明能够有效抵御复杂网络攻击,提高网络系统的安全性。
技术关键词
动态防御方法
样本
生成对抗网络
动态修改系统
网络安全保护技术
访问控制策略
入侵检测系统
蜜罐系统
模型训练模块
动态防御系统
深度Q网络
计算机程序指令
存储计算机程序
计算机程序产品
模块通信
网络系统
系统为您推荐了相关专利信息
地图模型
训练样本集
长短期记忆网络
位置定位方法
短距离
智能估值系统
模型训练模块
人工智能算法
XGBoost算法
账号资产
风险识别方法
交通流
鲸鱼优化算法
高斯核函数
超参数
露天采场
影像
交叉注意力机制
识别方法
伪标签生成器
性能优化设计方法
固井设备
仿真软件
水泥浆
理论