摘要
本发明公开了一种基于强化学习的多无人船编队围捕控制方法,包括构建受环境干扰影响的多无人船运动系统,构建围捕编队误差变量;基于围捕编队误差变量,采用反步法构建无人船的虚拟控制器;基于强化学习方法结合神经网络构建领导船编队围捕控制器;基于自适应反步方法结合李亚普诺夫理论与神经网络,构建跟随船编队围捕控制器;根据领导船编队围捕控制器与跟随船编队围捕控制器,实现对目标船舶的编队围捕控制。解决了在多无人船编队高效执行围捕任务过程中遭受风、浪、流等复杂海洋环境的干扰,使得多无人船控制性能不足的问题,无法充分体现追逐无人船之间的协同合作关系,造成多无人船编队控制困难,难以以尽可能小的代价实现控制的问题。
技术关键词
无人船编队
围捕控制方法
表达式
船舶运动模型
变量
前馈控制器
矩阵
强化学习方法
非线性
坐标系
反馈控制器
方程
误差函数
神经网络权值
放射系统
动态
系统为您推荐了相关专利信息
PH值
非线性回归模型
时间序列模型
厂务系统
多项式