摘要
本发明涉及机器人自动控制技术领域,特别是涉及一种基于强化学习的仓储机器人路径规划方法,包括:S1、获取目标仓储机器人当前状态信息;S2、将所述当前状态信息构建为时序状态序列后,输入预设的路径规划模型中,输出动作信息,并控制所述目标仓储机器人执行所述动作信息,其中,所述路径规划模型通过结合TD3算法、LSTM网络、多头注意力机制和HER经验回放机制构建;S3、迭代循环S1‑S2,直至所述目标仓储机器人达到目标位置,完成所述目标仓储机器人的路径规划。本发明能够实现仓储机器人的路径规划方法,使仓储机器人在复杂的环境中高效、安全地完成任务。
技术关键词
仓储机器人
多头注意力机制
机器人自动控制技术
动态障碍物
网络
位置更新
时序
路径规划方法
依赖特征
算法
序列
样本
标志
指数
误差
系统为您推荐了相关专利信息
电子飞镖系统
数字孪生
神经网络处理器
感应地板
人体关键点检测
数模混合芯片
多通道并行
毫米波频段
校准方法
神经网络模型
绿色建筑设计
评估指标体系
BIM技术
深度神经网络
深度强化学习技术
优惠券
管理方法
风险评估模型
人工智能技术
金融