摘要
本发明属于最优控制技术领域,提供一种基于长短期记忆网络的近似动态规划控制方法及系统,方法包括:构建长短期记忆网络,对长短期记忆网络的网络参数和算法迭代参数进行初始化设定,得到初始化参数;从被控对象的状态空间中均匀采样多个初始状态,依据初始化参数,确定每个初始状态对应的轨迹数据和终端状态;依据轨迹数据和终端状态,确定每个初始状态对应的代价目标值,依据所有初始状态和各自对应的代价目标值,建立训练数据集;依据训练数据集对长短期记忆网络进行迭代训练,直至满足设定迭代终止条件,得到最优值函数和最优控制策略。本发明提供的方案,提升了在连续时间下非线性系统的最优控制环节的控制可靠性、控制效率及可拓展性。
技术关键词
长短期记忆网络
近似动态规划
参数
控制策略
轨迹
终端
数据
控制权
矩阵
表达式
非线性系统
采样模块
对象
算法
闭环
优化器
方程
控制系统
系统为您推荐了相关专利信息
多代理系统
优化控制方法
优化预测模型
指数
图谱
CT重建方法
迭代算法
泊松噪声
代数重建算法
CT扫描数据
变压器运行数据
故障预警方法
气象
变压器运行状态
故障预测模型
密度仪
在线检测方法
极片
数据处理器
在线检测装置