摘要
本发明公开了一种机械臂的动作决策方法、装置、设备、介质及产品。该方法包括:获取机械臂当前时间步的运动状态信息,并获取当前时间步的环境信息;所述环境信息是通过部署于机械臂的环境感知设备采集的包含有目标物体的点云数据;根据当前时间步的运动状态信息以及当前时间步的环境信息,基于预先构建的动作决策模型,确定下一时间步的动作决策;所述动作决策模型是基于强化学习对机械臂执行历史抓取任务过程中的动作决策进行训练得到的。本技术方案解决了机械臂运动决策效率低下的问题,通过构建动作决策模型,可以有效提高动作决策效率,保证运动决策的可靠性。
技术关键词
运动状态信息
强化学习模型
机械臂末端执行器
决策方法
环境感知设备
物体
关节
平滑度
数据
可读存储介质
周期
计算机程序产品
电子设备
处理器通信
系统为您推荐了相关专利信息
调控策略
调控方法
设备运行状态数据
强化学习模型
集群
串联弹性驱动器
LuGre摩擦模型
四足机器人
阿基米德螺旋线
关节力矩
剪切增稠流体
视觉伺服控制
导纳控制方法
机械臂运动学
控制机械臂运动
综合管理系统
管理方法
数据存储结构
工作流执行
更新知识图谱