摘要
本发明公开了一种双深度Q网络的超低温真空二维转台保温自抗扰控制方法,方法为对二维转台温控系统进行辨识建模,利用扩张状态观测器ESO实时估计与补偿未建模动态和外界干扰。采用强化学习算法,建立观测器与控制器参数的马尔科夫决策过程模型,包括状态空间、动作空间以及奖励函数。设计双深度Q网络,当前网络选择动作,目标网络计算Q值进行动作评估,训练过程中采用贝尔曼方程进行Q值更新,训练目标为最大化累计奖励。最终将训练完成的DDQN‑ADRC网络应用于超低温二维转台控制实例,在改变设定值以及外加扰动的两种工况下与PID控制器、定参数的ADRC控制器仿真进行对比,算法表现出更优的跟踪精度、抗扰能力与鲁棒性能。
技术关键词
二维转台
深度Q网络
扩张状态观测器
强化学习算法
PID控制器
真空
保温
跟踪系统
系统传递函数
鲁棒性分析
热控
参数
聚酰亚胺薄膜
闭环
随机方法
计算机装置
系统为您推荐了相关专利信息
智能化方法
LSTM模型
电网资源调度
电力通信网
通信资源分配
辅助电源系统
并联均流
斩波模块
LCL滤波器
降压模块
序列优化方法
退役动力电池
强化学习环境
人机协同
策略
空调控制方法
历史运行数据
控制策略
深度强化学习算法
人体红外传感器
物流作业
监管方法
物联网感知设备
强化学习方法
节点