摘要
本发明公开了基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法,包括以下步骤:S1、通过relu激活网络对系统动力学模型和不确定性边界进行建模;S2、确定鲁棒性条件,并将其用于预先确定吸引域的面积;S3、确定动力学模型不确定性和状态估计下的鲁棒性保证RL;S4、网络参数化建立;S5、对倒立摆和四旋翼无人机进行数值模拟。本发明采用上述的基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法,仍然可以准确地找到最违逆的状态,从而强制其在不确定性下的稳定性,给出了鲁棒RL问题解存在性的几何视图来解释鲁棒性及其能力,在各种不确定性下对倒立摆和四旋翼机的数值模拟证明了所提出方法的有效性。
技术关键词
李雅普诺夫函数
不确定性系统
鲁棒性
分段线性函数
旋翼无人机
混合整数线性规划
顶点
损失函数设计
分区
学习控制器
网络
特征值
嵌套
机器人系统
参数
饱和度
表达式
旋翼机
系统为您推荐了相关专利信息
大型机床
估计方法
机床结构
协方差矩阵
概率密度函数
灰狼算法
光斑定位方法
像素点
类间方差
定位系统
体预测方法
训练集数据
组合预测模型
卫星定位技术
全局特征提取