摘要
一种基于深度强化学习的自适应模型鲁棒性增强方法,包括以下步骤:步骤1:构建动态对抗评估环境,含深度强化学习的状态空间、动作空间和奖励函数;步骤2:构建和训练鲁棒性评估模型,含深度强化学习与CycleGAN协同框架;步骤3:利用模型智能体对可能影响模型决策的区域进行渐进式位置优化与对抗补丁生成,产生用于对抗训练的对抗样本,增强模型的鲁棒性。本发明通过上述方法,利用深度强化学习来搜索目标模型的薄弱点,从而有针对性地通过对抗训练来增强其鲁棒性。
技术关键词
深度强化学习模型
补丁
图像
决策
鲁棒性评估
样本
坐标
生成对抗网络
深度Q网络
深度神经网络
贪婪策略
批量数据
生成算法
动态
输入流
框架
对抗性
系统为您推荐了相关专利信息
字段
校正方法
报表
多臂老虎机
执行光学字符识别
传感特征
环境监测方法
水下无人机
海洋牧场
环境监测数据
缺失检测方法
特征提取网络
神经网络模型
输入输出关系
空间结构关系