基于循环深度确定性策略梯度算法的机器人控制方法及系统

正文

推荐专利

申请号：CN202510296111

申请日期：2025-03-13

公开号：CN120742659A

公开日期：2025-10-03

类型：发明专利

摘要

本发明涉及一种基于循环深度确定性策略梯度(RDDPG)算法的机器人控制方法及系统，旨在提升机器人在复杂动态环境下的决策和控制能力。该方法包括以下步骤：首先，将机器人控制系统建模为部分可观测马尔可夫决策过程，定义环境状态、动作空间、状态转移概率、奖励函数和观测函数；其次，采用循环神经网络构建循环编码器，将机器人的运动时序数据及环境观测时序数据作为输入，输出用于辨识环境差异的元参数；接着，设计评估价值网络、评估策略网络、目标价值网络和目标策略网络，生成控制动作并评估其价值；最后，通过回放记忆存储机器人与环境交互的经验数据，利用时序差分学习更新网络参数，并采用移动平均法更新目标网络参数。本发明通过引入循环编码器，充分利用环境信息的时序特征，增强了机器人在复杂动态环境中的适应性、学习能力和决策准确性，可广泛应用于工业自动化、智能物流、服务机器人等领域。

技术关键词

机器人控制系统机器人控制方法编码器存储机器人参数人机交互模块网络评估策略决策算法输入接口控制策略 Sigmoid函数记忆数据总线电机驱动单元

系统为您推荐了相关专利信息

一种银行用可视化服务终端控制系统及方法

服务终端人脸识别信息互动桌面面部特征节点

一种用户的产品复购情况预测方法及装置

随机森林模型 LightGBM模型异质遗传算法样本

一种灯光色温低下的卷烟现场真伪测试方法

反光低色温建立卷烟曲线相关系数阈值

一种改进外观特征处理的行人多目标跟踪方法及系统

轨迹置信度跟踪方法跟踪器轨迹特征训练检测器

电力设备多物理场孪生模型的动态更新方法、装置、设备、存储介质和程序产品

预训练模型电力设备样本油浸式电力变压器动态更新方法

基于循环深度确定性策略梯度算法的机器人控制方法及系统

站点导航

APP 下载