摘要
本发明提供了一种基于强化学习的工业控制系统防护方法及相关设备,方法包括,将针对工业控制系统的攻击流程分为四个攻击阶段,获取当前攻击的入侵数据,并根据入侵数据的特征数据确定当前攻击所属的攻击阶段;将攻击阶段和已选防御策略作为系统状态,已选防御策略包括至少一个防御组件;采用ϵ\epsilonϵ‑贪婪策略,从预设动作空间中选择目标防御组件,得到目标防御策略,并通过模拟攻击记录在预设奖励函数下目标防御策略的奖励值和新状态数据;基于奖励值和新状态数据通过强化学习算法更新Q表,直至攻击者若进入完全控制阶段或连续防御失败;根据Q表得到最优防护策略,并根据最优防护策略完成对工业控制系统的防护。
技术关键词
工业控制系统
强化学习算法
贪婪策略
阶段
数据
可读存储介质
处理器
防护系统
数学
模块
存储器
计算机
电子设备
因子
速度
系统为您推荐了相关专利信息
敏感数据识别
备份
管理方法
数据安全
数据分析模块
水质在线分析方法
水流速
水质在线分析系统
采样点
数据获取单元
医学图像分割方法
样本
标记
优化神经网络
分割医学图像