摘要
本申请提供了一种码垛规划模型训练方法、码垛方法及相关装置,涉及计算机技术领域。该方法包括:在深度强化学习过程中,基于第一待码垛物体的第一物体尺寸信息,利用当前码垛规划模型在整个码垛空间中进行位置规划,得到第一待码垛物体的第一放置位置;根据总奖励函数、第一物体尺寸信息及第一放置位置,计算得到总奖励,第一放置位置在码盘平面所在平面距离码垛机器人越远且放置位置的高度越低,基于总奖励函数得到的总奖励越大;根据得到的总奖励对当前码垛规划模型的参数进行更新,以得到目标码垛规划模型。如此,可使得在实际码放过程中尽可能地优先向在码盘平面距离码垛机器人较远、较低的位置放置物体,从而提高稳定性及安全性。
技术关键词
码垛机器人
模型训练方法
码垛方法
规划
物体
深度强化学习
尺寸
模型训练装置
码盘
远距离
处理器
可读存储介质
存储器
参数
电子设备
模块
指令
系统为您推荐了相关专利信息
成像
Hadamard矩阵
液晶空间光调制器
非暂态计算机可读存储介质
物体
时效性
路径规划服务
任务分配策略
微服务架构
任务调度
危险品车辆
路径优化方法
节点
车辆路径优化
路段