基于需求预测和深度强化学习的多级库存控制方法及系统

正文

推荐专利

申请号：CN202510831383

申请日期：2025-06-20

公开号：CN120893938A

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了基于需求预测和深度强化学习的多级库存控制方法及系统，首先，利用需求预测模型得到需求预测数据，并将其适应性转变为多产品、多仓库环境下的数据；基于马尔可夫决策过程建模，其中状态向量包含各仓库的库存水平、在途订单数量及过去需求值，动作向量为生产量和补货量，奖励函数以系统总成本的负值激励智能体降低成本；通过深度强化学习DRL算法求解库存控制决策，并与需求预测数据对比决策，考虑季节性波动因素调整安全库存量。本发明结合需求预测模型和DRL的优势，弥补了传统DRL在多产品、多仓库复杂条件下的决策不足，有效控制季节波动性大的产品库存，在两级库存控制系统中实现成本优化与市场波动应对的平衡。

技术关键词

库存控制方法深度强化学习需求预测模型连续动作空间库存控制系统决策仓库环境更新网络参数最小化系统数据生成轨迹订单策略周期定义时间段基线偏差

系统为您推荐了相关专利信息

未知障碍物环境下无人机路径规划方法及系统

障碍物连续动作空间 SAC算法无人机机载传感器更新网络参数

基于SAC强化学习的传感器故障识别方法、系统及介质

深度强化学习模型航空发动机网络数据获取模块样本

车辆数据联邦动态稀疏训练方法、装置、设备及存储介质

稀疏训练方法客户端深度强化学习车辆动态

基于深度强化学习的虚拟职场多维度考核方法及系统

转移概率矩阵检查点决策深度强化学习模型序列

电厂夜间照明调度方法

模糊Petri网红外感应设备 TensorFlow框架差分隐私保护电力消耗最小化

基于需求预测和深度强化学习的多级库存控制方法及系统

站点导航

APP 下载