摘要
本发明公开了一种基于联邦强化学习的多智能体协同决策方法,首先通过建立基于联邦强化学习的多智能体协同决策模型,令中心服务器初始化再随机选择客户端,客户端将本地模型初始化为全局模型,训练更新参数后上传,中心服务器再聚合并更新全局模型参数直至模型训练完毕,完成多智能体协同决策。本发明的方法利用联邦学习的方式训练强化学习模型同时结合两类经验数据的相似性加权交错,能够在保证强化学习模型有效性的同时,为多方联合训练同一模型提供可能,在保证数据隐私安全性的同时提升数据样本丰富度与模型训练效率。
技术关键词
中心服务器
客户端
网络
决策方法
多智能体协同
强化学习模型
参数
数据采集器
策略
学习算法
状态更新
矩阵
样本
有效性
表达式
拷贝
度量
模块
系统为您推荐了相关专利信息
光电探测器
空穴传输层
钙钛矿光
有机光活性层
聚苯乙烯磺酸盐
影像变化检测方法
无人机遥感影像
孪生神经网络
多通道特征
异构
通道剪枝
因子
多通道
U型结构
地质灾害识别技术
手术室智能
手术场景
视频识别
监测方法
残差神经网络
医学影像数据
诊断系统
分析模块
多模态医学影像
特征提取模块