摘要
本发明公开了一种基于联邦多智能体SAC算法的无人艇协同围捕方法,包括:构建欠驱动无人艇的三自由度运动学模型;基于SAC算法建立单智能体的策略学习模型,采用最大熵目标进行策略训练与优化;设计集中式训练—分布式执行架构;建立联邦聚合机制;构建联邦多智能体SAC算法框架,实现多智能体间策略协同更新与围捕控制任务的高效执行。该方法结合SAC算法和集中式训练—分布式执行机制,实现多智能体策略优化;通过联邦平均算法实现多智能体策略参数的周期性聚合,提升全局策略一致性与系统协同能力。本发明可实现多智能体策略协同优化,具备通信效率高、策略收敛快、适应性强等优点,适用于复杂环境下的无人艇围捕任务。
技术关键词
围捕方法
SAC算法
策略
网络
算法框架
参数
非线性水动力
欠驱动无人艇
坐标系
多层感知机
服务器
速度
矩阵
周期性
非线性特征
机制
处理器
决策
系统为您推荐了相关专利信息
数据分流方法
机票预订平台
数据分流设备
数据分流系统
营销活动信息
数据构造方法
训练样本数据
预训练语言模型
构造系统
图像增强算法
径向基函数神经网络
扰动观测器
系统控制方法
指令滤波器
定义
海底地貌
分类模型训练方法
网络
分类模型训练系统
参数