一种多智能体强化学习可迁移的方法、装置以及设备

正文

推荐专利

申请号：CN202411081505

申请日期：2024-08-08

公开号：CN118627587B

公开日期：2024-12-10

类型：发明专利

摘要

本发明公开了一种多智能体强化学习可迁移的方法、装置以及设备，其包括：对多智能体环境中实体的通用属性进行拆解，得到通用实体类以及对应的实体属性；基于所述通用实体类以及所述实体属性对实体进行特征定义和编码，得到实体特征序列；对所述实体特征序列进行特征的提取和融合，得到融合特征；基于所述融合特征进行实体的动作解耦，得到包括非指向性动作以及指向性动作的实体动作；利用强化学习算法将所述融合特征以及所述实体动作在不同的想定场景中进行泛化训练，得到多智能体模型；将所述多智能体模型部署至相应的目标想定场景中进行知识的迁移。能够更有效地迁移和应用已学习的知识，降低了对特定环境的依赖，提高了模型的泛化能力。

技术关键词

多智能体强化学习实体多智能体模型融合特征强化学习算法序列场景坦克无人机模拟系统动态连续型更新模型参数身份编码动作模块弹药注意力标识

系统为您推荐了相关专利信息

基于随机化关键位和多算法调度的非定量计算方法及装置

定量计算方法比特流强化学习算法场景大数据分析算法

一种基于大模型和知识图谱检索增强的民政服务问答方法

问答方法答案三元组构建知识图谱大语言模型

用电检查场景自动化高效建模方法及系统

场景建模系统建模方法数据融合算法数据采集模块强化学习算法

基于产品零部件三维模型的图形模态设计知识挖掘方法

知识挖掘方法生成三维对象三维图形数据 PCL点云库三维模型

用于金属废料处理的智能控制系统及方法

智能控制方法破碎设备智能控制系统进料视频内容特征

一种多智能体强化学习可迁移的方法、装置以及设备

站点导航

APP 下载