摘要
本发明涉及仓储物流管理技术领域,尤其涉及一种基于深度强化学习的动态拣货路径优化方法及系统,包括基于仓库结构化编码数据解析得到拣选器状态向量;根据待处理订单队列数据和拣选器状态向量计算各通道内订单的移动价值密度;根据拣选器状态向量和待处理订单队列数据定义状态空间;基于状态空间和离散执行动作空间,将仓库订单拣选问题建模为马尔可夫决策过程;基于拣选器实时状态和移动价值密度,利用深度强化学习神经网络模型求解马尔可夫决策过程,得到最优拣货路径决策;根据最优拣货路径决策控制拣选器执行拣选操作。本发明结合深度强化学习神经网络模型求解马尔可夫决策过程,实现对拣货路径的精准优化,有效提升了仓库订单拣选的效率。
技术关键词
拣货路径优化方法
深度强化学习
订单
仓库基础结构
平均等待时间
特征提取单元
神经网络模型
决策
通道
高维特征向量
队列
数据
特征提取模块
动态
密度
仓储物流管理
实时位置
布局
系统为您推荐了相关专利信息
attention机制
司机
活动特征
订单
注意力机制
智能优化调度方法
企业资源规划
深度强化学习算法
策略
物流
虚拟惯量
直流输电
深度神经网络模型
面向区域电网
电网频率响应
终端接入认证方法
物联网节点设备
信道
组网协议
密钥交换协议
资源管理中心
深度强化学习模型
资源分配方法
基地
马尔可夫模型