摘要
本发明提出一种基于AER‑DDPG算法的机械臂轴孔装配方法及系统,属于机器人自动化装配领域。根据机械臂当前位姿和工件位姿,采用基于树搜索的路径规划策略生成关节轨迹,控制机械臂抓取工件;基于AER‑DDPG算法构建深度强化学习模型,输入状态空间生成动作指令,控制机械臂将工件移动至安装位置完成装配;深度强化学习模型中,双价值网络采用两个价值网络,通过取最小值计算目标Q值抑制过估计;自适应经验回放机制将经验池划分为成功经验池和失败经验池,并基于时间差分动态调整两类经验的采样比例。本发明通过取两价值网络最小值抑制Q值过估计,提升训练稳定性;基于时间差分动态调整成败经验采样,提升机械臂轴孔装配效率与可靠性。
技术关键词
轴孔装配方法
深度强化学习模型
机械臂末端执行器
工件位姿
生成动作
轴孔装配系统
网络
算法
策略
关节
机制
笛卡尔坐标系
轨迹
提升机械
装配模块
规划
动态
系统为您推荐了相关专利信息
物流机器人
深度强化学习模型
云端
执行控制策略
数据
时间同步方法
模态传感器
高精度时间同步
网络拓扑结构
时延
除草机器人
虚拟仿真平台
避障方法
数字孪生
数据采集系统
机构仿真
深度强化学习模型
仿真方法
节点
仿真系统
机械臂末端执行器
轨迹
关节
时间优化方法
驻留时间分布