摘要
本发明涉及一种基于强化学习的炼油厂生产维护协同优化方法,包括以下步骤:收集生产案例,通过监督学习从生产案例中提取生产决策知识,初始化强化学习的Actor网络;针对多周期生产维护协同优化,构建马尔可夫决策模型和生产计划模型;基于分层强化学习的生产维护协同优化框架,将马尔可夫决策模型和生产计划模型以互补的方式通过双向信息交换结合,再采用PPO算法优化求解得到优化后的生产计划和渣油加氢装置维护周期。与现有技术相比,本发明具有求解效率高、稳定性强等优点。
技术关键词
协同优化方法
渣油加氢装置
金属沉积
计划
决策
分层强化学习
原料供给量
原油
储罐
周期
表达式
监督学习方法
策略
网络
算法
负荷
定义
框架
关系
参数
系统为您推荐了相关专利信息
控制决策模块
轨道占用状态
轨道列车
环境感知数据
时刻表
智慧城市规划
模糊综合评价
数据融合算法
监控算法
数据采集模块
智能调控系统
检测机器人
数据分析模块
数据采集模块
尺寸特征