面向强化学习模型隐私保护的任务执行方法、设备、介质

AITNT
正文
推荐专利
面向强化学习模型隐私保护的任务执行方法、设备、介质
申请号:CN202510224992
申请日期:2025-02-27
公开号:CN120277704A
公开日期:2025-07-08
类型:发明专利
摘要
本发明公开了面向强化学习模型隐私保护的任务执行方法、设备、介质,包括:基于MAPPO构建任务执行场景;接收该场景中智能体决策模型的当前状态,根据当前状态计算智能体决策模型做出的策略与推荐策略间的相似度,从而更新状态;构建一评估神经网络,所述评估神经网络用于根据更新后的状态来估计隐私预算;构建一目标评估神经网络,所述目标评估神经网络与评估神经网络的网络架构相同,所述目标评估神经网络与评估神经网络协同更新训练,以阐述最大的隐私预算;目标评估神经网络基于当前状态输出最大隐私预算,根据最大隐私预算利用拉普拉斯机制为智能体的状态添加差分隐私,实现状态加密;通过状态加密的智能体输出任务执行策略,从而执行任务。
技术关键词
强化学习模型 拉普拉斯 策略 差分隐私 决策 表达式 网络架构 加密 处理器 场景 计算机程序产品 存储器 机制 可读存储介质 电子设备 指令 数据
系统为您推荐了相关专利信息
1
带气凝胶的储能电池主动安全消防系统
风险 消防系统 识别算法 储能电池模块 环境监测传感器
2
PCB加工谐振抑制方法、装置、设备及存储介质
谐振抑制方法 设备特性数据 频率响应 谐振抑制装置 模糊控制规则
3
服务器协同控制方法、存储介质及电子设备
可编程逻辑器件 协同控制方法 处理单元 基板管理控制器 通信链路
4
一种航班数据变更发布系统及方法
发布系统 子模块 状态更新 优化调度决策 PageRank算法
5
一种智能化心理危机识别系统
堆叠神经网络 语义特征提取 综合语义 粒子群优化算法 特征选择
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号