针对离线强化学习的隐蔽数据投毒攻击方法方法、系统、程序、设备及存储介质

正文

推荐专利

申请号：CN202510064154

申请日期：2025-01-15

公开号：CN120031097A

公开日期：2025-05-23

类型：发明专利

摘要

本发明公开了一种针对离线强化学习的隐蔽数据投毒攻击方法、系统、程序、设备及存储介质，属于离线强化学习技术领域。本发明方法采用关键时间步动态投毒攻击方法，通过对重要性较高的样本进行动态扰动，实现高效隐蔽的攻击效果。该方法首先通过理论分析发现时序差分误差对于模型学习过程的重要影响，分析得出时序差分误差较大的时间步代表离线强化学习的薄弱环节，将其作为投毒目标选择的依据。然后又提出了基于双目标优化的投毒方法，在最小化扰动幅度的同时，最大化攻击对模型性能产生的负面影响，为每个投毒样本生成最优扰动幅度。本发明以极低的攻击成本，实现了对离线强化学习模型的有效干扰，并确定了其在实际应用中的有效性和可行性。

技术关键词

离线数据误差模块强化学习技术智能体模型强化学习模型强化学习算法计算机装置规划算法计算机程序产品处理器指令时序可读存储介质存储器样本有效性动态

系统为您推荐了相关专利信息

训练数据集的录制方法、录制系统以及训练方法

虚拟现实头盔设备光学动作捕捉设备摄像装置虚拟现实系统录制方法

脉冲储能电容器结构状态的原位表征及评估方法和系统

储能电容器电路仿真模型计算机断层扫描装置脉冲声学检测装置

一种多指标反馈驱动的智能合约模糊测试方法和相关装置

模糊测试方法多指标种子数据流分析技术序列

一种基于量子保密通信的物联网数据传输系统

数据传输系统保密通信时间段密钥生成效率物联网设备

一种蓝色协调方法、协调单元、系统及存储介质

可调设备蓝色注意力机制规划指标

针对离线强化学习的隐蔽数据投毒攻击方法方法、系统、程序、设备及存储介质

站点导航

APP 下载