摘要
本申请提供一种基于强化学习的自抗扰参数优化方法、装置及电子设备,涉及动态受控对象的控制领域,该方法包括:获取动态受控对象的期望动作状态和该动态受控对象的自抗扰控制器的多个第一自抗扰参数;采用强化学习算法,对多个第一自抗扰参数进行优化,得到各第一自抗扰参数对应的第二自抗扰参数;基于各第二自抗扰参数和期望动作状态,确定性能误差函数;以最小化性能误差函数为目标,确定各第二自抗扰参数对应的目标自抗扰参数。该方法有效解决了动态受控对象在复杂动态环境中控制性能与安全保障难以兼顾的问题,不仅能显著提升动态受控对象的轨迹跟踪精度,还可在强气流扰动、模型不确定性等场景下维持系统稳定运行。
技术关键词
误差函数
参数优化方法
强化学习算法
扩张状态观测器
动态
参数优化装置
电子设备
通信接口
可读存储介质
投影方法
存储器
控制器
处理器
飞行器
计算机
轨迹
气流
矩阵
场景
系统为您推荐了相关专利信息
换热器控制方法
误差校正
换热工况
测地线距离
机制
参数优化方法
搜索算法
分布式计算技术
位置更新
集群
机械臂控制方法
轨迹
控制器模块
机械臂控制系统
控制机械臂运动