一种基于多对多合同设计的分层联邦多任务学习方法

正文

推荐专利

申请号：CN202511090396

申请日期：2025-08-05

公开号：CN120952108A

公开日期：2025-11-14

类型：发明专利

摘要

本发明提供了一种基于多对多合同设计的分层联邦多任务学习方法，首先由多个智能体生成多个合同，并将合同经环境处理后传递给每个设备集合，集合根据动态规划算法选择效用最高的几份合同并反馈给环境，环境根据集合的选择模拟计算每个智能体的效用，并将平均效用作为奖励反馈给智能体。MAPPO算法根据上述步骤迭代，每一轮迭代智能体都会将经验存放到经验池中，直到迭代满足一定条件，智能体会从经验池中获取经验来更新动作网络和评论家网络。本发明实现了从“一对多”到“多对多”的激励扩展，更贴近真实场景，还使用MAPPO算法在复杂的动态博弈的场景下设计合同激励，这种激励机制极大地提高了在复杂、非平稳和信息不完全环境下的适应性和鲁棒性。

技术关键词

多任务学习方法无人机基站服务器终端设备网络分层动态规划算法发布者参数能耗通信系统决策动作策略接收系统数据分布样本定义

系统为您推荐了相关专利信息

一种中央空调系统能效优化的联邦学习协同建模方法

协同建模方法中央空调系统设备运行数据多维特征向量负荷

一种基于改进GRU优化的模糊PID膨化机温度预测及控制方法

膨化机模糊PID控制器 GRU神经网络粒子群算法优化系统传递函数

基于多模态深度学习的软骨损伤识别系统与方法

损伤识别模型前馈神经网络多模态深度学习损伤识别系统图像

一种基于部分充电曲线的锂离子电池剩余容量预测方法

电池剩余容量粒子群优化算法曲线表达式时间卷积网络

一种电力监控网络安全检测方法及相关装置

监控网络安全网络流量数据支持向量机分类器异常数据电力监控技术

一种基于多对多合同设计的分层联邦多任务学习方法

站点导航

APP 下载