摘要
本发明公开了一种磁浮列车悬浮系统的安全强化学习控制方法、设备及介质,涉及磁浮控制技术领域,所述方法包括以下步骤:S1、构建悬浮系统动力学模型,作为训练环境;S2、将悬浮系统的控制问题建模为约束寻优问题;S3、将约束寻优问题转为无约束优化问题,对目标函数进行迭代求解;S4、构建代价函数,加快无约束优化问题的求解,设计惩罚项以引导系统状态远离安全边界;S5、在强化学习环境中,结合代价函数,对无约束优化问题进行迭代训练求解。本发明不依赖于精确的悬浮系统模型,无需针对每个特定挑战设计单独的控制策略,可通过与悬浮系统的交互自适应学习最优控制策略,具有较强的鲁棒性与灵活性。
技术关键词
磁浮列车悬浮系统
强化学习控制方法
方程
萨法尔定律
强化学习环境
构建代价函数
屏障
斩波器
系统动力学模型
引导系统
李雅普诺夫函数
气隙
神经网络结构
控制策略
强化学习算法
轨道
电磁铁线圈
处理器
系统为您推荐了相关专利信息
二维材料薄膜
脉冲激光系统
激光脉冲参数
调制器
动态规划模型
红外热成像仪
PE管道电熔
神经网络模型
电熔管件
图像重建
激光粒子计数器
智能控制方法
动态状态信息
PID控制器
PID控制系统
深度残差网络
粒子群优化算法
遗传算法
粒子群算法
多模态
裂缝监测方法
X射线成像
方程
控制采集系统
土体电阻率