基于双向深度强化学习的多无人船协同围捕训练方法

正文

推荐专利

申请号：CN202411109760

申请日期：2024-08-14

公开号：CN118626867B

公开日期：2024-10-08

类型：发明专利

摘要

本申请属于无人船智能控制技术领域，提供一种基于双向深度强化学习的多无人船协同围捕训练方法，包括以下步骤：建立基于深度强化学习的多无人船的协同围捕模型，所述协同围捕模型包括至少一个基于深度强化学习的围捕策略网络；建立机动目标的逃逸模型，所述逃逸模型包括至少两个非智能逃逸子模型以及至少一个基于深度强化学习的逃逸策略网络；对所述协同围捕模型及逃逸模型进行多任务双向深度强化学习训练，所述多任务双向深度强化学习训练包括至少三次正向训练任务以及至少一次反向训练任务。本申请提供的方法通过对深度强化学习训练方式进行优化，能够迅速提升多个无人船对各类机动目标进行高效协同围捕的能力。

技术关键词

深度强化学习无人船策略障碍物多任务样本阶段状态更新网络加速度人工势场方程参数场景误差运动轨迹算法

系统为您推荐了相关专利信息

一种全覆盖巡检路径生成方法

矢量地图巡检路径生成方法优化骨架线段

一种建筑垃圾的再生处理方法、设备及介质

垃圾分拣模型预训练模型再生设备建筑

一种新能源场站电磁暂态模型转化方法和相关装置

电磁暂态模型新能源场站数字量输入信号转化方法电气元件

基于多设备识别的智能化充电优先级分配系统及方法

功率多设备智能识别技术实时监测设备短时间

一种梯级水库智能调度方法

智能调度方法电网调度数据仿真模型综合数据库龙头水库

基于双向深度强化学习的多无人船协同围捕训练方法

站点导航

APP 下载