基于MAPPO与分层注意力机制结合的多智能体决策方法

正文

推荐专利

申请号：CN202510102755

申请日期：2025-01-22

公开号：CN120087434A

公开日期：2025-06-03

类型：发明专利

摘要

本发明提供了一种基于MAPPO与分层注意力机制结合的多智能体决策方法，每个智能体，将当前时刻的观测状态信息输入至自身引入局部注意力机制的策略网络中输出第一动作，并联合其他智能体的第二动作输入至引入全局注意力机制的价值网络，输出智能体的联合动作；策略网络的局部注意力机制能让智能体聚焦自身周边关键局部信息，价值网络的全局注意力机制可统揽整个战场的宏观情况，可以合理评估各智能体任务价值。当战场形势变化时，本发明可以借助这种双重视角的注意力机制能快速做出动态调整，并且MAPPO算法本身对智能体协作的强化作用，与注意力机制协同，按照任务需求和实时局势动态加权，做出更优化的决策，提高作战成功率。

技术关键词

分层注意力决策方法局部注意力机制网络策略优化方法感知周围环境多头注意力机制蒙特卡洛方法数据更新模块参数算法动态广义视角时序

系统为您推荐了相关专利信息

一种卤素光源网络控制系统及控制方法

单灯控制系统网络控制系统轨道灯网络控制方法亮度

一种基于堆叠泛化集成学习的未知伪造图像检测方法、介质及终端

伪造图像检测方法伪造方法学习器混合网络模型检测模型训练

一种滤饼成型动态压控智能调控方法

智能调控方法压滤机 PID控制器阶段长短期记忆网络

一种基于激光熔覆仿真模型的叶片修复方法及系统

性能预测模型仿真模型激光熔覆工艺激光熔覆修复过程卷积神经网络框架

一种便携式无线充电电子系统及方法

便携式无线充电动态特征提取充电策略反馈算法无线充电设备

基于MAPPO与分层注意力机制结合的多智能体决策方法

站点导航

APP 下载