摘要
本发明公开了一种基于通用合作知识的多智能体协作方法,包括以下步骤:确定任务领域,并选取若干个合作任务;构建多任务训练框架,所述训练框架包括为每一个合作任务设置的感知网络和决策网络,所述决策网络包括共享决策层和任务特定决策层;基于每一个合作任务,对所述多任务训练框架进行训练,基于训练后的决策网络,构建任务共享决策网络模型;将所述任务共享决策网络模型迁移到新的任务领域中进行训练,完成当前任务中多智能体的协作。本发明采用一种多任务的学习方法,通过将学得的共享策略网络应用于其它相同或不同领域的合作任务中进行训练,促进智能体之间的协作和协调。
技术关键词
决策网络模型
协作方法
多任务
强化学习算法
框架
更新网络参数
协作系统
学习方法
模块
处理器
可读存储介质
存储器
电子设备
程序
策略
系统为您推荐了相关专利信息
率测量方法
神经网络框架
物理
红外热波无损检测
热传导方程
学习推荐方法
视角
多任务联合学习
注意力机制
评分系统
数据融合方法
分布式系统
子系统
深度融合网络
交互特征
跨模态融合特征
融合控制方法
多模态数据融合
预训练语言模型
多任务联合训练
再生混凝土
试样固定装置
加压板
建筑材料力学性能测试
PID算法控制