摘要
本发明公开了一种考虑示教关键点的深度强化学习机械臂路径规划方法,属于机器人技术领域。本发明实现方法为:依照实际装配场景搭建仿真环境;获取示教关键点,示教关键点是装配主体处于起始点、路径点和目标点位置时的位姿;通过凹度计算、树搜索递归分割,得到凸分解结果,实现高精度碰撞检测;基于示教关键点,设计深度强化学习的动作空间、状态空间及奖励函数;奖励函数包括碰撞奖励、到达奖励、距离奖励、示教到达奖励、示教姿态奖励和步数奖励;基于SAC深度强化学习算法,结合示教关键点设计状态空间和奖励函数,以此加速算法的收敛速度,提升策略性能,使机械臂能够在复杂装配场景中快速规划出无碰撞的路径。
技术关键词
关键点
机械臂关节
仿真环境
网络
策略
场景
障碍物
规划
装配工作台
无碰撞
状态更新机制
深度强化学习算法
参数
关节角增量
元素
仿真平台
系统为您推荐了相关专利信息
干扰信号消除方法
注意力机制
神经网络模型
编码器
干扰信号消除系统
分流设备
控制服务器
规则管理系统
规则管理方法
拆分规则
汽车测试装置
智能网联汽车
数据采集模块
汽车测试系统
高精度定位模块
网络配置方法
设备认证
网络配置系统
网络业务
解密
光纤网络
调水工程
健康监测系统
故障分类模型
云端管理平台