一种多智能体强化学习决策系统及其联合训练方法

正文

推荐专利

申请号：CN202411674678

申请日期：2024-11-21

公开号：CN119578501A

公开日期：2025-03-07

类型：发明专利

摘要

本发明涉及一种多智能体强化学习决策系统及其联合训练方法，该系统包括多智能体包括协调智能器和N个单智能体，N大于等于1，每个单智能体相互独立，用于从各自的微场景中，获取完成子任务目标需要的环境样本，采用各自独立的强化学习智能算法，分别为子任务目标进行智能决策；协调智能器，用于获取总任务目标需要的环境样本，采用强化学习智能算法，根据预设的规则，优选单智能体的决策，使得总任务目标达到最优。

技术关键词

强化学习模型联合训练方法多智能体强化学习决策系统多智能体系统多阶段智能算法参数实时状态信息训练系统仿真环境样本层次化结构训练智能体智能体模型场景策略更新逻辑

一种多智能体强化学习决策系统及其联合训练方法

站点导航

APP 下载