摘要
本申请属于无人船智能控制技术领域,提供一种基于双向深度强化学习的多无人船协同围捕训练方法,包括以下步骤:建立基于深度强化学习的多无人船的协同围捕模型,所述协同围捕模型包括至少一个基于深度强化学习的围捕策略网络;建立机动目标的逃逸模型,所述逃逸模型包括至少两个非智能逃逸子模型以及至少一个基于深度强化学习的逃逸策略网络;对所述协同围捕模型及逃逸模型进行多任务双向深度强化学习训练,所述多任务双向深度强化学习训练包括至少三次正向训练任务以及至少一次反向训练任务。本申请提供的方法通过对深度强化学习训练方式进行优化,能够迅速提升多个无人船对各类机动目标进行高效协同围捕的能力。
技术关键词
深度强化学习
无人船
策略
障碍物
多任务
样本
阶段
状态更新
网络
加速度
人工势场
方程
参数
场景
误差
运动
轨迹
算法
系统为您推荐了相关专利信息
电磁暂态模型
新能源场站
数字量输入信号
转化方法
电气元件
智能调度方法
电网调度数据
仿真模型
综合数据库
龙头水库