摘要
本申请公开了一种具有未知滞后的多智能体系统固定时间最优控制方法,包括构建高阶随机非线性多智能体系统模型,并定义坐标变换,所述高阶随机非线性多智能体系统模型包括跟随者智能体的动力学模型和领航者智能体的动力学模型;基于最优控制原理,引入最优性能指标函数,获得Hamilton‑Jacobi‑Bellman方程;通过基于identifier‑critic‑actor结构的强化学习算法求解Hamilton‑Jacobi‑Bellman方程并使用神经网络的逼近性质,设计最优控制器和identifier神经网络、critic神经网络和actor神经网络的更新率;引入Bouc‑Wen滞后模型,得到第l步的动态系统,坐标变换和Hamilton‑Jacobi‑Bellman方程;证明critic神经网络和actor神经网络估计权重误差,构建李雅普诺夫函数,进行固定时间稳定性分析并获得多智能体系统固定时间稳定的充分条件。
技术关键词
时间最优控制方法
多智能体系统
李雅普诺夫函数
强化学习算法
方程
代表
坐标
变量
定义
控制器
近似误差
矩阵
指标
参数
动态
符号
非线性
系统为您推荐了相关专利信息
智能服装设计方法
骨骼关键点
力学模型参数
电导传感器
层次分析法
神经网络算法
d轴电感
q轴电感
电流
同步电机参数
雷达波形设计方法
深度强化学习算法
雷达抗干扰
决策
雷达散射截面
多模态数据融合
缺陷检测方法
多物理场建模
多源检测数据
缺陷检测系统