摘要
本发明属于智能控制领域,具体说是基于增量式双Q学习的自适应模型预测控制方法,包括以下步骤:1)建立非完整约束差速移动机器人的运动学模型,结合其运动学模型构建轨迹跟踪误差模型;2)基于轨迹跟踪误差模型,构建移动机器人轨迹跟踪模型预测控制器的预测模型,并依据该预测模型实现高性能轨迹跟踪控制;3)对双Q学习智能体的动作空间、状态空间进行增量式的离散化操作;4)通过智能体与环境之间的实时交互和在线迭代学习,来不断地优化双Q学习智能体的状态和动作空间,通过得到在线自适应MPC控制器,来实现移动机器人的高精度自主轨迹跟踪控制。本发明利用增量式双重Q学习算法对MPC的权重矩阵进行在线优化,根据系统状态实时调整MPC权重矩阵,以优化总奖励。
技术关键词
模型预测控制方法
移动机器人
模型预测控制器
误差模型
轨迹跟踪控制
在线
矩阵
Q学习算法
代表
记忆
加速度
存储计算机程序
贪婪策略
控制误差
系统为您推荐了相关专利信息
数据终端
牵引拖车
移动机器人
角度调节平台
检索方法
地图构建方法
移动机器人位姿
P3P算法
静态特征
动态
优化控制方法
深度学习模型
气象站
时间序列预测模型
协同控制策略
超宽带定位系统
移动机器人
标签
定位方法
Chan算法
欠驱动水下机器人
轨迹跟踪控制方法
偏航角误差
补偿器
网络