摘要
本发明公开了一种基于示教学习的高效MPC决策增强方法。首先,该方法运用贝尔曼最优性原理推导出原无穷时域最优控制问题的最优子问题;再根据最优子问题及观测解集,利用逆向KKT条件构建从最优示教片段中同时高效学习的MPC代价函数权重和有效决策约束的非线性规划命题;最后,针对MPC无穷时域性能损失问题,结合示教数据,使用终端约束集和终端代价函数设计混合0‑1整数非线性规划命题,使有限时域的MPC具备无穷时域性能补偿能力。本发明不仅能够更加高效地同时学习MPC的有效决策约束和代价函数权重参数,还能够补偿MPC的无穷时域性能,提升MPC的整体控制效果,使MPC具备从人工示教中学习和不断提升决策性能的能力。
技术关键词
误差状态
变量
决策
拉格朗日
整数非线性规划
示教数据
终端
状态空间模型
KKT条件
松弛
表达式
方程
参数
人类
索引
周期
系统为您推荐了相关专利信息
建筑节能控制方法
气象预报数据
分层优化算法
长短期记忆网络
建筑BIM模型
挤干设备
挤干辊
压力执行机构
皮尔逊相关系数
带钢
资源分配优化方法
双层迭代算法
基站
全双工
波束成形设计
人工智能模型
管理系统
线性变换矩阵
连续型
医学图像数据