基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法

AITNT
正文
推荐专利
基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法
申请号:CN202411584075
申请日期:2024-11-07
公开号:CN119439743B
公开日期:2025-11-14
类型:发明专利
摘要
本发明公开了基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法,包括以下步骤:S1、通过relu激活网络对系统动力学模型和不确定性边界进行建模;S2、确定鲁棒性条件,并将其用于预先确定吸引域的面积;S3、确定动力学模型不确定性和状态估计下的鲁棒性保证RL;S4、网络参数化建立;S5、对倒立摆和四旋翼无人机进行数值模拟。本发明采用上述的基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法,仍然可以准确地找到最违逆的状态,从而强制其在不确定性下的稳定性,给出了鲁棒RL问题解存在性的几何视图来解释鲁棒性及其能力,在各种不确定性下对倒立摆和四旋翼机的数值模拟证明了所提出方法的有效性。
技术关键词
李雅普诺夫函数 不确定性系统 鲁棒性 分段线性函数 旋翼无人机 混合整数线性规划 顶点 损失函数设计 分区 学习控制器 网络 特征值 嵌套 机器人系统 参数 饱和度 表达式 旋翼机
系统为您推荐了相关专利信息
1
一种基于关键条件商的大型机床静态结构不确定性响应估计方法
大型机床 估计方法 机床结构 协方差矩阵 概率密度函数
2
一种针对联邦学习范式的分布式多目标后门攻击方法、程序、设备及存储介质
后门 客户端 中心服务器 样本 离散余弦变换技术
3
基于灰狼算法的多目标光斑定位方法及系统
灰狼算法 光斑定位方法 像素点 类间方差 定位系统
4
基于残差补偿的电离层不规则体预测方法
体预测方法 训练集数据 组合预测模型 卫星定位技术 全局特征提取
5
一种基于深度学习的人岗匹配方法
员工 关系 注意力机制 节点 BERT模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号