摘要
本发明公开了一种基于通道注意力机制深度强化学习算法的多无人艇协同围捕方法,包括以下步骤:建立海上无人艇围捕博弈环境,确定围捕艇的动力学模型以及观测空间,逃逸艇的逃逸策略定义围捕成功的条件;基于通道注意力网络将无人艇对友方的观测空间维数固定;构建多智能体深度确定性策略梯度算法框架,结合围捕问题设计距离协作和角度协作的奖励函数;采用集中训练,分布执行的训练框架生成多无人艇协同围捕策略。本发明得到的协同围捕策略考虑了不同围捕艇的数量影响,能够适应未来不确定数量的围捕环境变化,同时合理的单体协同奖励函数设计能够提高围捕任务的成功率。
技术关键词
深度强化学习算法
通道注意力机制
多无人艇协同
围捕方法
策略
连续动作空间
更新网络参数
海上无人艇
无人艇集群
岛礁
坐标
定义
处理器
算法框架
计算机程序产品
系统为您推荐了相关专利信息
神经网络模型
粒子群寻优算法
神经网络参数
计算机可读指令
物理
分配装置
在线客服系统
排队策略
数据收集模块
人工智能算法
钙钛矿太阳能电池
节点
网络
数据
启发式搜索算法
应力采集装置
高精度三维模型
模型预测值
数据接收模块
材料老化试验