摘要
本发明公开了一种不锈钢重卷机组速度与张力耦合控制表面质量的方法,属于不锈钢生产控制技术领域。该方法首先建立不锈钢重卷机组的马尔可夫决策过程模型,定义包括速度、张力、表面质量、卷取均匀性和运行速度等状态变量,建立状态转移模型,设计三层奖励函数;然后设计控制策略,初始化深度Q网络,采用经验回放和目标网络技术提高学习效率和稳定性,将状态输入深度Q网络输出最优控制策略,并实时反馈进行学习;判断是否达到收敛条件,若达到则输出最优控制策略,包括将学习到的最优策略保存至策略库,根据当前工况选取最适合的控制策略,并对策略进行噪声模拟提高可靠性。本发明能够有效提高不锈钢重卷过程中的表面质量和卷取均匀性。
技术关键词
重卷机组
状态转移模型
深度Q网络
控制策略
不锈钢
速度
工况
Q学习算法
波纹缺陷
偏差
网络结构
样本
初始化存储器
动态变化规律
随机噪声
动态更新
网络技术