摘要
本发明提供一种基于强化学习的速调管状态反馈控制方法,包括:建立强化学习模型,基于速调管的状态来定义状态,基于低电平控制系统的幅度与相位设置值来定义动作,基于速调管当前与理想状态的偏离程度及动作后偏离程度的变化量来定义奖励,使用引擎接收来自于环境的幅度与相位设置值,并将得到的速调管的状态发送给环境;在训练模式下使用虚拟引擎以加速模型训练,在控制模式下则切换到真实引擎并利用以上述模型为反馈算法的低电平控制系统对实际加速器的速调管状态进行反馈控制。本发明的方法能提升低电平控制系统对速调管状态的控制精度,使速调管输出更加稳定,且能大幅减少反馈控制算法迭代到最优过程所需的训练时间。
技术关键词
速调管
状态反馈控制方法
强化学习模型
控制系统
加速器
加速模型训练
数据
ReLU函数
模式
定义
反馈算法
多层感知机
元素
网络
滤波
噪声
参数
离线
策略
因子
系统为您推荐了相关专利信息
定向能量沉积
红外相机
PID闭环控制
激光光斑直径
水冷接口
手持电子设备
电梯控制器
电梯控制系统
验证码系统
人脸识别模块
障碍物地图
双目相机
协处理器
数据
AGV控制技术
组合控制方式
亮度误差
自动亮度控制
电压
PID控制方式