摘要
本发明公开了一种基于DSAW离线强化学习算法的冗余驱动机械臂路径规划方法,属于机械臂三维空间路径规划领域。针对三维空间内碰撞检测问题,通过包围法将路径节点与障碍物之间的碰撞关系简化为球体与长方体之间的碰撞关系,避免碰撞问题;针对强化学习路径规划环境的设计问题,从位置、碰撞约束、步长限制等多个方面设计了基础奖励函数、碰撞惩罚奖励函数、目标奖励函数来引导冗余驱动机械臂学习达到目标点的行为策略。然后采用模型预测控制算法对路径上的节点进行逆解计算,求出对应关节角度。其使用方便,计算效率高,保证了冗余驱动机械臂路径最优求解的关节移动角度。
技术关键词
驱动机械臂
冗余
强化学习算法
模型预测控制算法
路径规划方法
离线
球体
深度确定性策略梯度
逆动力学模型
机械臂关节
长方体
MPC算法
价值估计方法
坐标
障碍物碰撞检测