基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法

正文

推荐专利

申请号：CN202411584075

申请日期：2024-11-07

公开号：CN119439743B

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开了基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法，包括以下步骤：S1、通过relu激活网络对系统动力学模型和不确定性边界进行建模；S2、确定鲁棒性条件，并将其用于预先确定吸引域的面积；S3、确定动力学模型不确定性和状态估计下的鲁棒性保证RL；S4、网络参数化建立；S5、对倒立摆和四旋翼无人机进行数值模拟。本发明采用上述的基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法，仍然可以准确地找到最违逆的状态，从而强制其在不确定性下的稳定性，给出了鲁棒RL问题解存在性的几何视图来解释鲁棒性及其能力，在各种不确定性下对倒立摆和四旋翼机的数值模拟证明了所提出方法的有效性。

技术关键词

李雅普诺夫函数不确定性系统鲁棒性分段线性函数旋翼无人机混合整数线性规划顶点损失函数设计分区学习控制器网络特征值嵌套机器人系统参数饱和度表达式旋翼机

系统为您推荐了相关专利信息

一种基于关键条件商的大型机床静态结构不确定性响应估计方法

大型机床估计方法机床结构协方差矩阵概率密度函数

一种针对联邦学习范式的分布式多目标后门攻击方法、程序、设备及存储介质

后门客户端中心服务器样本离散余弦变换技术

基于灰狼算法的多目标光斑定位方法及系统

灰狼算法光斑定位方法像素点类间方差定位系统

基于残差补偿的电离层不规则体预测方法

体预测方法训练集数据组合预测模型卫星定位技术全局特征提取

一种基于深度学习的人岗匹配方法

员工关系注意力机制节点 BERT模型

基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法

站点导航

APP 下载