一种融合图注意力机制的多智能体强化学习编队自适应方法

正文

推荐专利

申请号：CN202510760477

申请日期：2025-06-08

公开号：CN120540099A

公开日期：2025-08-26

类型：发明专利

摘要

本发明涉及多智能体协同控制技术领域，公开一种融合图注意力机制的多智能体强化学习编队自适应方法。该方法通过构建动态图状态空间，结合速度自适应通信机制与多目标回报函数，解决智能体数量变化或拓扑结构动态调整时的泛化能力不足问题。方案包括：建立虚拟领导‑跟随编队模型与运动动力学模型；设计基于速度变化的自适应通信半径公式；构建图状态空间，利用多头注意力机制动态聚合邻居信息；设计带残差连接的策略网络与价值评估网络；采用集中式训练分布式执行框架更新模型参数。通过图注意力机制实现关键邻居信息自适应提取，结合动态通信范围调整，提升编队系统在复杂环境中的适应性与稳定性。适用于无人机群控、机器人协作等场景。

技术关键词

策略网络模型编队协同控制多头注意力机制障碍物多智能体编队多层感知机邻居控制误差独立编码器加速度策略更新方法执行运动控制定义多智能体协同

系统为您推荐了相关专利信息

基于三维点云航线自动规划的无人机无感安全督查巡检方法及系统

巡检方法杆塔点云数据标注无人机飞行高度规划

感知模型的评测方法和装置、存储介质及电子设备

场景标签评测方法数据获取单元车间

基于自适应注意力机制的局部放电检测网络系统

局部放电检测多头注意力机制深度学习网络网络系统诊断模块

一种基于深度神经网络的序列到序列建模算法对被伪迹污染的脑电信号进行去伪处理的方法

深度神经网络建模算法电信号交叉注意力机制序列

基于多级哈尔小波增强的无人车动态检测与路径优化方法

路径优化方法动态障碍物检测点云强度无人车主成分分析法

一种融合图注意力机制的多智能体强化学习编队自适应方法

站点导航

APP 下载