摘要
本发明涉及机械臂运动规划领域,涉及一种基于改进人工势场法和深度强化学习多机械臂运动规划方法,针对深度强化学习在多机械臂系统中,前期奖励稀疏,训练速度较慢,难以学习到有效策略的特点,本发明提出了改进的动态人工势场专家演示方案,通过在训练过程中,添加随着训练进程动态改变的人工势场奖励函数和动态人工势场专家演示机制,使得机械臂在前期的训练过程中获得更高的学习效率并获得更多的正样本,在后期训练中辅助机械臂到达高精度目标,进而加快机械臂的学习速度。训练过程主要包括以下步骤:构建仿真环境,对多机械臂路径规划任务进行描述和建模,生成训练样本,执行训练任务并进行仿真,根据仿真结果动态调整专家数据,经验收集和策略更新。相比于传统方法,本方法具有更快的收敛速度,更短的训练时间以及更高的精度,尤其是具有更快的前期收敛速度和较高的拟合精度。
技术关键词
全局路径规划方法
局部路径规划方法
强化学习策略
人工势场
末端执行器
深度确定性策略梯度
机械臂运动规划
深度强化学习方法
动态
数据
策略更新
代表
生成训练样本
辅助机械臂
系统为您推荐了相关专利信息
无人艇
拦截方法
更新地图信息
一致性算法
状态反馈控制
机器人操纵方法
三维坐标信息
末端执行器
动作预测模型
三维姿态信息
智能管理方法
数据管理平台
神经卷积网络
大数据
强化学习网络
铁路路基病害
多层次特征融合
Softmax函数
诊断方法
振动加速度信号