一种多智能体强化学习可迁移的方法、装置以及设备

AITNT
正文
推荐专利
一种多智能体强化学习可迁移的方法、装置以及设备
申请号:CN202411081505
申请日期:2024-08-08
公开号:CN118627587B
公开日期:2024-12-10
类型:发明专利
摘要
本发明公开了一种多智能体强化学习可迁移的方法、装置以及设备,其包括:对多智能体环境中实体的通用属性进行拆解,得到通用实体类以及对应的实体属性;基于所述通用实体类以及所述实体属性对实体进行特征定义和编码,得到实体特征序列;对所述实体特征序列进行特征的提取和融合,得到融合特征;基于所述融合特征进行实体的动作解耦,得到包括非指向性动作以及指向性动作的实体动作;利用强化学习算法将所述融合特征以及所述实体动作在不同的想定场景中进行泛化训练,得到多智能体模型;将所述多智能体模型部署至相应的目标想定场景中进行知识的迁移。能够更有效地迁移和应用已学习的知识,降低了对特定环境的依赖,提高了模型的泛化能力。
技术关键词
多智能体强化学习 实体 多智能体模型 融合特征 强化学习算法 序列 场景 坦克 无人机 模拟系统 动态 连续型 更新模型参数 身份 编码 动作模块 弹药 注意力 标识
系统为您推荐了相关专利信息
1
基于随机化关键位和多算法调度的非定量计算方法及装置
定量计算方法 比特流 强化学习算法 场景 大数据分析算法
2
一种基于大模型和知识图谱检索增强的民政服务问答方法
问答方法 答案 三元组 构建知识图谱 大语言模型
3
用电检查场景自动化高效建模方法及系统
场景建模系统 建模方法 数据融合算法 数据采集模块 强化学习算法
4
基于产品零部件三维模型的图形模态设计知识挖掘方法
知识挖掘方法 生成三维对象 三维图形数据 PCL点云库 三维模型
5
用于金属废料处理的智能控制系统及方法
智能控制方法 破碎设备 智能控制系统 进料 视频内容特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号