摘要
本发明属于车间调度相关技术领域,其公开了一种基于Soft Actor‑Critic强化学习的资源协同装调车间自适应调度方法及系统,方法包括:构建加工工件任务池、加工工件选择规则、拓扑单元分配规则、协作工人分配规则以及智能体模型,智能体模型包括多层感知机模块以及基于Soft Actor‑Critic算法的策略模块;采用多层感知机模块获取车间环境当前状态下各加工工件选择规则的权重向量,采用权重向量对加工工件任务池中的各工件的优先权重进行重组,获得各工件复合规则下的权重;以各工件复合规则下的权重,在拓扑单元分配规则以及协作工人分配规则下进行拓扑单元和协作工人分配。本发明能够对不同状态下的最优策略进行拟合,增强了智能体模型的决策能力。
技术关键词
工件
智能体模型
多层感知机
车间
模块
策略
决策
资源
样本
调度系统
网络
指标
算法
参数
列表
数据
系统为您推荐了相关专利信息
性能评测方法
智能分析引擎
功能模块
专网
NoSQL数据库
医学图像分类
细粒度特征
对齐系统
特征提取模块
无监督
chirp波形
前端控制方法
可编程芯片
前端控制系统
参数
分析系统
分析模块
资源弹性分配策略
测试用例优先级
项目