一种基于知识蒸馏的多任务多智能体协同控制方法

正文

推荐专利

申请号：CN202510579680

申请日期：2025-05-01

公开号：CN120493977A

公开日期：2025-08-15

类型：发明专利

摘要

本发明涉及信息技术领域，公开了一种基于知识蒸馏的多任务多智能体协同控制方法，解决连续动作空间下多任务多智能体系统中训练效率低下以及干扰严重的问题，主要方案包括以下步骤：设计适应多任务状态维度变化以及根据文本语义信息区分任务的策略网络模型与评估网络模型；设计用于多任务多智能体协同控制的层级回放池；设计基于知识蒸馏的深度强化学习的策略模型更新方法。针对连续动作空间下的多个任务，提出深度强化学习多智能体协同控制方法，并设计了统一不同任务状态输入以及根据任务文本语义信息区分任务模块，提升智能体对任务状态维度变化的适应能力以及对任务的区分能力，设计了用于多任务多智能体的层级回放池，降低任务之间的干扰。

技术关键词

多任务策略网络模型多智能体系统状态编码器深度强化学习障碍物蒸馏多层感知机邻居连续动作空间文本加速度多智能体协同控制语义系统控制误差策略更新方法

一种基于知识蒸馏的多任务多智能体协同控制方法

站点导航

APP 下载