摘要
本发明属于最优控制技术领域,提供一种基于长短期记忆网络的近似动态规划控制方法及系统,方法包括:构建长短期记忆网络,对长短期记忆网络的网络参数和算法迭代参数进行初始化设定,得到初始化参数;从被控对象的状态空间中均匀采样多个初始状态,依据初始化参数,确定每个初始状态对应的轨迹数据和终端状态;依据轨迹数据和终端状态,确定每个初始状态对应的代价目标值,依据所有初始状态和各自对应的代价目标值,建立训练数据集;依据训练数据集对长短期记忆网络进行迭代训练,直至满足设定迭代终止条件,得到最优值函数和最优控制策略。本发明提供的方案,提升了在连续时间下非线性系统的最优控制环节的控制可靠性、控制效率及可拓展性。
技术关键词
长短期记忆网络
近似动态规划
参数
控制策略
轨迹
终端
数据
控制权
矩阵
表达式
非线性系统
采样模块
对象
算法
闭环
优化器
方程
控制系统
系统为您推荐了相关专利信息
字段
编辑界面
计算机执行指令
关键词
自定义参数
识别规则库
异常识别方法
大语言模型
访问日志数据
访问控制策略
地震随机反演方法
变量
密度
地震反射系数
地球物理油气勘探技术
多无人机协同
安全控制方法
深度强化学习算法
策略
无人机集群
文本信息提取
大语言模型
图谱
策略
PostgreSQL数据库