摘要
本发明公开了一种多智能体强化学习可迁移的方法、装置以及设备,其包括:对多智能体环境中实体的通用属性进行拆解,得到通用实体类以及对应的实体属性;基于所述通用实体类以及所述实体属性对实体进行特征定义和编码,得到实体特征序列;对所述实体特征序列进行特征的提取和融合,得到融合特征;基于所述融合特征进行实体的动作解耦,得到包括非指向性动作以及指向性动作的实体动作;利用强化学习算法将所述融合特征以及所述实体动作在不同的想定场景中进行泛化训练,得到多智能体模型;将所述多智能体模型部署至相应的目标想定场景中进行知识的迁移。能够更有效地迁移和应用已学习的知识,降低了对特定环境的依赖,提高了模型的泛化能力。
技术关键词
多智能体强化学习
实体
多智能体模型
融合特征
强化学习算法
序列
场景
坦克
无人机
模拟系统
动态
连续型
更新模型参数
身份
编码
动作模块
弹药
注意力
标识
系统为您推荐了相关专利信息
定量计算方法
比特流
强化学习算法
场景
大数据分析算法
场景建模系统
建模方法
数据融合算法
数据采集模块
强化学习算法
知识挖掘方法
生成三维对象
三维图形数据
PCL点云库
三维模型
智能控制方法
破碎设备
智能控制系统
进料
视频内容特征