摘要
本发明涉及一种基于深度强化学习的接触式加工机器人运动规划方法,所述方法包括:首先,基于DH参数和齐次变换矩阵建立了六自由度机械臂末端状态向量与基座、关节运动向量之间的位置级正、逆运动学模型;其次,综合考虑加工任务、进给速度、进给角度等约束,设计了多级奖励函数对作业参数规划;然后基于双延迟深度确定性策略梯度设计网络结构,对算法进行三层次优化;最后,依据网络结构设计规划流程,以磨抛加工为例,应用于智能接触式加工机械臂系统的规划任务中。本发明能够通过自主学习实现对接触式加工工艺多种加工参数的实时优化与控制,可用于接触式加工工艺动力学耦合情况下的智能安全规划。
技术关键词
机器人运动规划方法
坐标系
深度强化学习
接触式
通用动力学模型
柔性磨盘
参数表示法
网络
机械臂系统
机械臂关节
深度确定性策略
机器人运动学模型
机械臂末端执行器
机械臂逆运动学
算法结构
圆盘
作业参数
系统为您推荐了相关专利信息
手机信令数据
智能管控方法
微观交通仿真
深度强化学习算法
评价指标体系
暴力事件检测方法
二维卷积神经网络
音频
音视频
摄像头坐标系
空间大数据技术
综合评估方法
历史降雨量
方程
河流含沙量