一种子任务语义不变的多智能体策略模型迁移方法与系统

正文

推荐专利

申请号：CN202410958934

申请日期：2024-07-17

公开号：CN118863008B

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种子任务语义不变的多智能体策略模型迁移方法与系统。本发明通过可扩展子任务编码器将待执行的多智能体任务编码为可执行的子任务，并将该子任务分配给执行多智能体任务中的每个智能体，然后通过自适应动作解码器将分配好的子任务以及当前智能体的观测数据来计算出智能体与环境交互的具体动作；当待执行的多智能体任务发生变化时，可扩展子任务编码器和自适应动作解码器可确保分配的子任务在各个多智能体任务间具有一致且可扩展的语义，同时分解到的子任务赋予了任务独立性，进而实现多智能体策略模型在各个多智能体任务间的模型迁移。本发明可实现多智能体策略模型在各个多智能体任务间的模型迁移。

技术关键词

实体编码器模型迁移方法注意力机制解码器语义向量强化学习策略交互动作模块轨迹迁移系统多层感知器存储计算机程序场景定义处理器可读存储介质

一种子任务语义不变的多智能体策略模型迁移方法与系统

站点导航

APP 下载