一种基于事后筛选经验回放的机器人跟踪控制学习方法

正文

推荐专利

申请号：CN202411641640

申请日期：2024-11-18

公开号：CN119427356B

公开日期：2025-06-24

类型：发明专利

摘要

本发明涉及机械臂轨迹跟踪领域，尤其涉及一种基于事后筛选经验回放的机器人跟踪控制学习方法，包括：初始化目标网络参数和经验池，并将状态转移元组贮存至经验池；当经验池中状态转移元组数量大于预设状态转移元组数量时，根据机器人机械臂的轨迹平滑度以及节点共变度确定动作复杂状态；根据动作复杂状态确定经验池优化方式；选取预估位置偏差大于或等于标准预估位置偏差的经验作为筛选经验，并根据筛选经验数量确定经验选择方式；对cr it ic网络和actor网络进行更新，并分别针对cr it ic网络和actor网络的target网络进行软更新；根据奖励评估值针对cr it ic网络的target网络以及actor网络的target网络的软更新权重进行调节，本发明提高了模型的跟踪效果和跟踪稳定性。

技术关键词

控制学习方法网络平滑度机器人偏差随机梯度下降轨迹节点参数数值序列误差机械臂关系力矩关节速度因子

系统为您推荐了相关专利信息

一种水利工程用的水质检测取样系统

数据分析中心取样系统水库水质监测数据传输子系统指纹

一种基于表型基因引导的分子优化方法

分子表型特征结构模块一维卷积神经网络交叉注意力机制

飞机运动轨迹确定方法、装置、电子设备及存储介质

历史运行数据飞机预测运动轨迹时间段数据更新

一种发送端、接收端、信号传输系统及方法

网络分配器网线双绞线信号传输系统发送端

推理任务的处理方法、装置及电子设备

时延策略服务器算法能耗

一种基于事后筛选经验回放的机器人跟踪控制学习方法

站点导航

APP 下载