摘要
本发明公开了一种基于深度强化学习的固定时间无人船编队围捕控制方法,包括获取围捕编队误差变量与围捕编队动态误差变量;构建无人船的固定时间虚拟控制器,以获取无人船的第一李亚普诺夫函数的最终导数;构建无人船的固定时间自适应前馈控制律,以获取无人船的第二李亚普诺夫函数的最终导数;获取无人船的前馈李亚普诺夫函数的导数;根据前馈李亚普诺夫函数的导数构建无人船的固定时间最优反馈控制律;根据无人船的固定时间自适应前馈控制律与固定时间最优反馈控制律,实现对目标船舶固定时间的编队围捕控制。解决了目前高维无人船编队交互难,不能确保无人船编队系统状态在独立于初始状态的相同时间范围内收敛,降低了协同围捕效率的问题。
技术关键词
围捕控制方法
深度强化学习
无人船系统
深度神经网络
表达式
动态误差
反馈控制器
变量
前馈控制器
非线性
船舶
无人船编队系统
时间控制器
矩阵
非光滑
在线
强化学习方法
系统为您推荐了相关专利信息
风电场环境
应对自然灾害
深度学习模型
注意力机制
跨模态
轨道耦合动力学模型
钢轨廓形
高速列车车辆
NURBS曲线
遗传算法
故障诊断模型
智能故障诊断
轻量化方法
机械设备故障诊断
动态规划模型
转向梯形机构
方程式赛车
粒子群算法
群遗传算法
齿条拉杆