摘要
本发明涉及多智能体协同控制技术领域,公开一种融合图注意力机制的多智能体强化学习编队自适应方法。该方法通过构建动态图状态空间,结合速度自适应通信机制与多目标回报函数,解决智能体数量变化或拓扑结构动态调整时的泛化能力不足问题。方案包括:建立虚拟领导‑跟随编队模型与运动动力学模型;设计基于速度变化的自适应通信半径公式;构建图状态空间,利用多头注意力机制动态聚合邻居信息;设计带残差连接的策略网络与价值评估网络;采用集中式训练分布式执行框架更新模型参数。通过图注意力机制实现关键邻居信息自适应提取,结合动态通信范围调整,提升编队系统在复杂环境中的适应性与稳定性。适用于无人机群控、机器人协作等场景。
技术关键词
策略网络模型
编队协同控制
多头注意力机制
障碍物
多智能体编队
多层感知机
邻居
控制误差
独立编码器
加速度
策略更新方法
执行运动控制
定义
多智能体协同
系统为您推荐了相关专利信息
巡检方法
杆塔
点云数据标注
无人机飞行高度
规划
局部放电检测
多头注意力机制
深度学习网络
网络系统
诊断模块
深度神经网络
建模算法
电信号
交叉注意力机制
序列
路径优化方法
动态障碍物检测
点云强度
无人车
主成分分析法