面向强化学习模型隐私保护的任务执行方法、设备、介质

正文

推荐专利

申请号：CN202510224992

申请日期：2025-02-27

公开号：CN120277704A

公开日期：2025-07-08

类型：发明专利

摘要

本发明公开了面向强化学习模型隐私保护的任务执行方法、设备、介质，包括：基于MAPPO构建任务执行场景；接收该场景中智能体决策模型的当前状态，根据当前状态计算智能体决策模型做出的策略与推荐策略间的相似度，从而更新状态；构建一评估神经网络，所述评估神经网络用于根据更新后的状态来估计隐私预算；构建一目标评估神经网络，所述目标评估神经网络与评估神经网络的网络架构相同，所述目标评估神经网络与评估神经网络协同更新训练，以阐述最大的隐私预算；目标评估神经网络基于当前状态输出最大隐私预算，根据最大隐私预算利用拉普拉斯机制为智能体的状态添加差分隐私，实现状态加密；通过状态加密的智能体输出任务执行策略，从而执行任务。

技术关键词

强化学习模型拉普拉斯策略差分隐私决策表达式网络架构加密处理器场景计算机程序产品存储器机制可读存储介质电子设备指令数据

系统为您推荐了相关专利信息

带气凝胶的储能电池主动安全消防系统

风险消防系统识别算法储能电池模块环境监测传感器

PCB加工谐振抑制方法、装置、设备及存储介质

谐振抑制方法设备特性数据频率响应谐振抑制装置模糊控制规则

服务器协同控制方法、存储介质及电子设备

可编程逻辑器件协同控制方法处理单元基板管理控制器通信链路

一种航班数据变更发布系统及方法

发布系统子模块状态更新优化调度决策 PageRank算法

一种智能化心理危机识别系统

堆叠神经网络语义特征提取综合语义粒子群优化算法特征选择

面向强化学习模型隐私保护的任务执行方法、设备、介质

站点导航

APP 下载