摘要
一种基于数据驱动的工程系统容错跟踪控制方法,属于工程控制方法技术领域。包括如下步骤:S1、建立故障下工程系统等价模型,定义性能指标函数和相应的值函数,从而将最优控制问题转化为零和博弈问题;S2、针对工程系统状态不可测的问题,利用历史输入输出数据对状态进行重构,从而设计求解最优控制策略;S3、引入并定义Q函数,对控制器增益及扰动增益进行设计,并结合设计的无模型非策略Q‑学习输出反馈算法对优化,得到最优控制器。通过注塑成型工业过程和自治水下机器人(AUV)的深度控制仿真实验,验证了该算法的收敛性以及所设计控制器优良的跟踪控制效果。
技术关键词
工程系统
容错跟踪控制方法
反馈算法
自治水下机器人
工程控制方法
数据驱动设计
重构
定义
优化控制策略
控制器
矩阵
干扰误差
执行器
学习算法
玩家
传感器
理论
线性
系统为您推荐了相关专利信息
纵联差动保护
继电保护测试仪
继电保护装置
噪声抑制滤波器
通信架构
热辐射光源
控制电路
铂金电极
电阻温度系数
特性实时监测
时间片
软件设计方法
任务调度
工作周期
载荷控制系统
图像生成系统
大语言模型
意图识别
工程系统
训练样本集