摘要
本发明涉及涉及工业控制与优化技术领域,公开了一种基于PPO算法的干燥机群调度方法,包括以下步骤:S1、将干燥机群的工作状态和罐体状态建模为马尔可夫决策过程;S2、定义状态空间、动作空间和奖励函数;S3、使用PPO算法训练策略网络和价值网络,以优化干燥机群的调度,所述S1步骤具体包括以下步骤:S1.1、构建罐体状态表,记录每个罐体是否完成再生作业,以及是否可以进行干燥作业;S1.2、构建干燥机群工作状态表。通过优化干燥机群的调度,将再生作业安排在电费较低的低谷时段,从而大幅降低总电费支出,并且采用深度强化学习中的PPO算法,结合马尔可夫决策过程模型,通过不断与环境交互和学习,使得智能体能够自主优化调度策略,提高调度效率。
技术关键词
罐体
网络
算法
优化调度策略
决策
深度强化学习
定义
因子
待机
工业
参数
系统为您推荐了相关专利信息
禽流感灭活疫苗
乳化方法
动态预测模型
磁力搅拌设备
接触角测量仪
模型训练方法
数据
图像重建方法
图像重建装置
分支
识别分析方法
像素块
薄片
小波多尺度分解
灰度矩阵