一种基于强化学习的前置仓分拣线路规划方法

正文

推荐专利

申请号：CN202510375854

申请日期：2025-03-27

公开号：CN120297535A

公开日期：2025-07-11

类型：发明专利

摘要

本发明公开一种基于强化学习的前置仓分拣线路规划方法，包括如下步骤：S1：构建智能体P和智能体R，并分别定义智能体P和智能体R的状态空间、动作空间、奖励函数及优化目标；S2：对智能体P和智能体R的所有参数及策略进行初始化；S3：对构建的智能体P和智能体R进行训练；S4：利用反向传播算法对策略梯度进行求导，计算梯度下降更新神经网络参数；S5：重复上述步骤S3～S4，得到训练完成的智能体P和智能体R，并规划前置仓分拣路线。本发明能够根据当前前置仓的库存情况、货架需求动态计算出最优分拣策略，包括分拣次数、每次分拣量以及分拣路线，确保分拣人员以最短的时间和最小的行走距离完成任务。

技术关键词

线路规划方法前置仓神经网络参数货架栅格梯度下降法策略规划最优路径传播算法定义生成随机数数据因子元素序列坐标偏差表格

系统为您推荐了相关专利信息

用于玉米高效育种的表型性状图像识别提取方法

纹理玉米多光谱传感器像素试验田

墙角清洁方法、机器人及计算机可读存储介质

清洁方法障碍物轮廓线段栅格

基于迭代算法的航空发动机风扇叶片栅格填充设计方法

栅格结构迭代算法叶片顶点壳体

一种面向时变通信约束的农机多机路径规划方法

路径规划方法节点通信特征排队等待时间无人农机

轨道搬运机器人和具有该轨道搬运机器人的仓储系统

行走轮组件搬运机器人货架单元升降轨道仓储系统

一种基于强化学习的前置仓分拣线路规划方法

站点导航

APP 下载