摘要
一种基于两阶段训练强化学习的自抗扰控制器参数优化方法,它属于计算机系统控制技术领域。本发明解决了现有方法采用自抗扰控制器时存在参数调节效率低、无法保证参数最优、依赖初始参数选择的问题。本发明的基于预训练和进阶强化学习的两阶段训练方法,在预训练阶段设计了基于速度误差的奖励函数,在进阶训练过程中设计了基于误差阈值的分段式奖励机制,将电机的速度跟踪过程划分为不同的区间,在不同区间以不同的奖励指导智能体训练,解耦性能指标,有效避免参数的局部最优,实现自抗扰控制器的参数最优。本发明方法可以应用于自抗扰控制器的参数优化。
技术关键词
深度强化学习模型
速度跟踪控制
两阶段
同步电机模型
误差
永磁
控制器
参数
稳态
非线性
分段
计算机系统
电流
符号
变量
机制