一种改进深度强化学习PPO的七自由度机械臂轨迹规划方法

正文

推荐专利

申请号：CN202510870903

申请日期：2025-06-26

公开号：CN120503206A

公开日期：2025-08-19

类型：发明专利

摘要

本发明公开了一种改进深度强化学习PPO的七自由度机械臂轨迹规划方法，属于工业机器人智能控制技术领域。针对深度强化学习在七自由度冗余机械臂轨迹规划中面临的学习能力不好和收敛速度慢的问题，设计分阶段奖励函数，通过两个阶段逐步引导七自由度机械臂完成任务。设计一种分层经验回放机制，依据奖励值将训练过程中的经验分别存储在优先经验存储区和次级经验存储区；通过无偏采样策略平衡两类存储区的采样比例，提升经验样本的利用率，与传统的优先经验回放机制相比，该方法在减少计算量的同时，有效避免了训练过程中的过拟合问题。通过分阶段奖励函数和分层经验回放机制有效缩短七自由度机械臂在复杂环境中的学习时间，显著提高了收敛速度。

技术关键词

深度强化学习冗余机械臂控制机械臂运动分阶段七自由度机械臂机械臂末端执行器工业机器人智能控制技术关节存储结构逆运动学分层机制策略规划轨迹障碍物样本

系统为您推荐了相关专利信息

一种超参数优化方法、装置、计算机设备及存储介质

状态向量数据风控模型性能指标数据贪婪算法超参数优化方法

一种基于图神经网络和深度强化学习的路由优化方法

深度强化学习节点网络状态信息迭代消息传递算法神经网络参数

一种基于最短路径的变电站通信路由路径自动规划方法

深度强化学习模型自动规划方法变电站通信网络实时状态信息深度Q网络

基于深度学习的洗涤剂控制方法、装置、洗衣机及介质

深度强化学习模型洗涤剂投放量策略洗涤机洗衣机

基于物联网的大豆胞囊线虫种群动态监测方法及系统

大豆胞囊线虫动态监测方法比率风险评估模型变量

一种改进深度强化学习PPO的七自由度机械臂轨迹规划方法

站点导航

APP 下载