融合数据新鲜度的联邦学习动态激励方法及装置

正文

推荐专利

申请号：CN202511066538

申请日期：2025-07-31

公开号：CN120930829A

公开日期：2025-11-11

类型：发明专利

摘要

本公开提供了一种融合数据新鲜度的联邦学习动态激励方法及装置，涉及人工智能技术领域。该方法包括：获取联邦学习中每个参与方的数据新鲜度；将该数据新鲜度输入多智能体强化学习模型，并执行以下操作：根据每个智能体的本地状态信息，利用预设的演员模型对本轮训练的数据批次大小进行独立决策，输出能够表征每个智能体在本轮训练中愿意提供的训练数据量或资源投入比例的动作；根据所有智能体的全局状态信息，利用预设的评论模型对所有智能体的动作进行价值评估，得到全局奖励；根据全局奖励，计算得到每个智能体的局部奖励；利用局部奖励更新每个智能体的策略参数，迭代训练直至该多智能体强化学习模型完成收敛。

技术关键词

多智能体强化学习新鲜度全局状态信息动态激励方法训练数据量强化学习模型策略参数模型更新决策处理器资源人工智能技术模块存储装置可读存储介质代币报酬代表

系统为您推荐了相关专利信息

一种基于分块流量预测的无人机辅助任务卸载方法

无人机轨迹优化强化学习环境卸载系统多智能体强化学习分块

一种基于云计算的校园人流大数据分析方法

大数据分析方法校园多维特征向量网格运动向量

基于多智能体强化学习的动车组视频协同缓存方法

多智能体强化学习动车组协同缓存方法缓存服务器视频服务系统

一种显示设备及伪造音频检测方法

样本显示设备音频检测方法分布特征预训练模型

一种基于行为树的多智能体黑盒策略解析方法及系统

解析方法多智能体强化学习策略非暂态计算机可读存储介质节点

融合数据新鲜度的联邦学习动态激励方法及装置

站点导航

APP 下载