针对离线强化学习决策模式多样性的投毒攻击方法、系统、程序、设备及存储介质

正文

推荐专利

申请号：CN202510064156

申请日期：2025-01-15

公开号：CN120031098A

公开日期：2025-05-23

类型：发明专利

摘要

本发明公开了一种针对离线强化学习决策模式多样性的投毒攻击方法、系统、程序、设备及存储介质，属于离线强化学习技术领域。本发明方法首先获取离线强化学习数据集中的状态空间、动作空间及奖励空间，分析数据集中连续状态‑动作对组成的经验决策序列的多样性，将数据集中较为罕见的决策序列作为关键序列。然后，针对这些关键序列对应的数据，本发明添加了精心构造的微小扰动来降低数据集中经验决策序列的多样性，以此实现对离线强化学习数据集的有效投毒。本发明攻击方法以极低的攻击成本，实现了对离线强化学习模型的有效干扰，并确定了其在实际应用中的有效性和可行性。

技术关键词

决策序列离线数据核心聚类方法模式强化学习技术智能体模型强化学习模型编码器模块肘部法则计算机装置关键点计算机程序产品因子处理器标签

系统为您推荐了相关专利信息

基于大语言模型的金融风险智能预警系统及方法

智能预警系统大语言模型任务调度集成模块风险

一种基于区块链的水产品溯源管理方法及系统

全生命周期数据水产品溯源网络平台管理方法全生命周期管理

基于虚拟遥杆和触控的压力感应融合控制方法及装置

触控点融合控制方法意图生成分类模型触控设备

面向装箱线生产作业的人员操作行为规范识别方法

专用数据集物品检测深度学习模型识别方法人体姿态识别技术

一种基于Floyd-Warshall算法的反窃电识别方法及系统

电力网络拓扑识别方法节点算法电力系统

针对离线强化学习决策模式多样性的投毒攻击方法、系统、程序、设备及存储介质

站点导航

APP 下载