摘要
本发明涉及人工智能技术,揭露了一种基于强化学习的机械臂轨迹优化方法。所述方法包括:首先,依据机械臂的关节信息构建连杆坐标系,并在此基础上建立机械臂的运动学模型;其次,搭建一个强化学习环境,其中以机械臂的旋转角和作业目标位姿作为输入状态,并将机器人工作过程中的稳定程度作为关键奖励项;接着,通过预训练的机械臂作业控制模型,执行基于姿势奖励和质心奖励的决策生成操作,从而生成机器人动作指令;最后,根据这些动作指令对目标机械臂机器人进行精确控制。本发明通过这种轨迹规划方法,实现了机器人运动的稳定性提升。
技术关键词
机械臂机器人
轨迹优化方法
灰度扫描图像
姿势
关节
马尔可夫算法
对象识别
作业需求
底座
强化学习环境
扫描设备
时间飞行法
轨迹规划方法
运动
指令
生成机器人