摘要
一种基于深度强化学习的MPC分层协同优化控制研究方法,包括步骤A、内层UA‑SAC误差学习与补偿控制,内层通过不确定性感知自适应优化控制算法,最终通过自适应调权重获取准确的误差模型;步骤B、外层多维耦合优化,外层基于学习所得到的误差模型,应用TD3算法实现渐进式强化学习优化控制,具体包括三个学习阶段:基于专家规则的初期学习阶段、基于性能反馈的渐进学习阶段和完全自主的优化学习阶段;步骤C、分层协同优化控制系统集成,采用分层协同控制架构,实现内外层通过信息交互协同优化,本发明的优点是:实现车辆在复杂地形高机动自主越野行驶对通过性、机动性、稳定性以及安全性方面的需求。
技术关键词
协同优化控制
深度强化学习
优化控制算法
强化学习框架
误差模型
分层协同控制
阶段
优化控制系统
算法架构
策略
生成机制
控制权
动态误差补偿
误差控制
信息交互接口
悬架
车辆动力学模型
网络
系统为您推荐了相关专利信息
模块通信
深度强化学习算法
特征数据库
蒙特卡洛树
肝纤维化治疗
智能化电缆
机控制系统
电缆敷设机
数据存储模块
人机交互模块
风速风向仪
风力发电机组
载荷
校准方法
遗传算法优化神经网络