基于改进深度确定性策略梯度算法的机器人运动控制方法

正文

推荐专利

申请号：CN202411534993

申请日期：2024-10-31

公开号：CN119036475A

公开日期：2024-11-29

类型：发明专利

摘要

本发明公开了基于改进深度确定性策略梯度算法的机器人运动控制方法，属于深度强化学习和机器人运动控制技术领域，通过自适应经验回放机制，对经验缓冲池中的经验数据进行筛选；通过经验数据的优先级采样策略，提升经验数据的利用效率；所述自适应经验回放机制，基于机器人的状态空间和动作空间的维度，设计多个经验缓冲区，并设计各缓冲区之间分类阈值的计算方式；所述经验数据的优先级采样策略，采用时间差分误差和即时奖励相结合的方式，计算出经验缓冲池中每个经验数据的样本优先级，将经验数据分发到不同的经验缓冲区。本发明加快收敛速度并提升最终运动控制策略的性能，增强机器人对复杂环境动态的适应能力和行为控制策略的稳定性。

技术关键词

仿真环境机器人模型数据机器可读程序分类阈值机器人运动控制装置机器人运动控制技术算法网络控制策略样本双腿机器人机制机器人仿真误差缓冲

系统为您推荐了相关专利信息

基于功能解耦的区块链分层架构及跨组件通信优化方法

通信优化方法节点通信组件存储组件点对点

路由路径优化方法、路由路径优化系统及电子设备

路径优化方法路径优化系统传输路径粒子群算法遗传算法

一种识别多类别精神障碍的方法

心率电信号医学影像数据深度学习模型磁共振成像数据

一种基于混合智能的任务规划方法、装置及存储介质

生成网络模型蒙特卡洛树搜索规划序列分层

一种面向电力工程的智能校审方法和系统

校审方法深度置信网络电力工程数据数字孪生模型区块链存证

基于改进深度确定性策略梯度算法的机器人运动控制方法

站点导航

APP 下载