摘要
本发明公开了一种基于深度强化学习的离散连续混合动作对抗攻击方法,涉及人工智能安全领域。利用动态系统状态驱动的对抗扰动攻击方案,深度融合离散动作扰动与连续动作扰动方法,以最小化系统奖励为目标,在最大对抗扰动范围内增大输出动作损失。进一步结合均匀攻击、策略定时攻击方法,设计了特定的偏好函数灵活选择对抗性攻击触发时机方法,增强了攻击的隐蔽性与破坏力,提升了DRL模型攻击效果。结合基于迁移性范式的黑盒攻击框架,采用基于替代模型的对抗攻击迁移方法,通过构建替代模型逼近目标策略的决策行为,并利用替代梯度生成对抗扰动在缺乏目标模型梯度信息的情况下,仍可实现有效的模型攻击,提高了对抗攻击对DRL模型攻击的泛化能力。
技术关键词
终端设备
深度强化学习模型
决策
时延
资源分配
策略
多标签
最小化系统
服务器
扰动方法
卸载系统
迁移方法
网络架构
参数
对抗性
能耗
符号
频率
系统为您推荐了相关专利信息
建筑外墙施工
物联网传感器数据
控制系统
计算机视觉分析
可视化模块