摘要
本申请涉及逆向供应链库存管理领域,公开了一种基于进化辅助多智能体强化学习的库存优化方法及系统,方法包括应用一经训练的进化辅助多智能体强化学习模型对供应链的实时运行数据进行处理,所述方法包括:获取供应链的实时运行数据,将所述供应链的实时运行数据输入至所述进化辅助多智能体强化学习模型进行处理,而后输出供应链库存最优策略。本申请通过进化辅助多智能体强化学习算法EAMARL结合多智能体强化学习算法MARL的在线适应能力和进化算法EA的全局搜索能力,使策略对逆向供应链中回收产品数量波动、定制订单需求不确定性及处理延迟等复杂动态具有更强的鲁棒性,显著提升库存管理效率。
技术关键词
多智能体强化学习
策略
库存优化方法
网络
进化算法
多智能体深度强化学习
仿真环境
数据采集单元
参数
中心控制单元
处理单元
粒子群优化算法
基准
定制订单
周期性
库存管理
位置更新
闭环
系统为您推荐了相关专利信息
贝叶斯神经网络
标准值计算方法
青藏高原
马尔科夫链蒙特卡洛方法
土体物理性质
多尺度特征融合网络
识别系统
无人机
高分辨率摄像头
图像采集单元
工业机器人编程
预防关节
机器人关节空间
绕工具轴线旋转
启发式策略