摘要
本发明属于最优控制技术领域,提供一种基于长短期记忆网络的近似动态规划控制方法及系统,方法包括:构建长短期记忆网络,对长短期记忆网络的网络参数和算法迭代参数进行初始化设定,得到初始化参数;从被控对象的状态空间中均匀采样多个初始状态,依据初始化参数,确定每个初始状态对应的轨迹数据和终端状态;依据轨迹数据和终端状态,确定每个初始状态对应的代价目标值,依据所有初始状态和各自对应的代价目标值,建立训练数据集;依据训练数据集对长短期记忆网络进行迭代训练,直至满足设定迭代终止条件,得到最优值函数和最优控制策略。本发明提供的方案,提升了在连续时间下非线性系统的最优控制环节的控制可靠性、控制效率及可拓展性。
技术关键词
长短期记忆网络
近似动态规划
参数
控制策略
轨迹
终端
数据
控制权
矩阵
表达式
非线性系统
采样模块
对象
算法
闭环
优化器
方程
控制系统
系统为您推荐了相关专利信息
电离层模型参数
辅助定位装置
天线姿态控制
信号接收模块
信号处理模块
城市洪涝灾害
监测预警系统
风险评估模型
混合预测模型
多项式
多传感器融合方法
障碍物轮廓
轨迹
异步方式
电子设备
运输机器人
流水线
三维虚拟模型
规划系统
处理单元
混合储能系统
飞轮储能单元
蓄电池单元
双闭环控制策略
变流器