摘要
本发明涉及一种基于过去经验的强化学习机械臂动态避障方法及系统。首先采用改进SAC算法构建神经网络;随后定义动作空间、状态空间及奖励函数,结合HER算法、经验回放池和课程学习对神经网络进行强化训练,使网络逐步收敛;训练后输出动作控制机械臂,实时检测碰撞与运动误差,依据检测结果动态更新网络参数;通过反复迭代环境交互与参数优化,最终实现机械臂精准避障并抵达目标位置。与现有技术相比,本发明具有灵活度高、适应性强等优点。
技术关键词
动态避障方法
机械臂
课程学习方法
SAC算法
末端执行器
障碍物
动态避障系统
长短期记忆网络
神经网络参数
运动误差
模块
轨迹
关节
动态更新
闭环控制
网络结构
系统为您推荐了相关专利信息
检查点
手术机器人系统
手术机械臂
手术装置
图形用户界面
防渗漏施工方法
混凝土孔洞
六自由度机器人
受限
铣刀
烹饪机器人
食品放置装置
食品放置盒
切换板
螺纹滑块