基于循环深度确定性策略梯度算法的机器人控制方法及系统

AITNT
正文
推荐专利
基于循环深度确定性策略梯度算法的机器人控制方法及系统
申请号:CN202510296111
申请日期:2025-03-13
公开号:CN120742659A
公开日期:2025-10-03
类型:发明专利
摘要
本发明涉及一种基于循环深度确定性策略梯度(RDDPG)算法的机器人控制方法及系统,旨在提升机器人在复杂动态环境下的决策和控制能力。该方法包括以下步骤:首先,将机器人控制系统建模为部分可观测马尔可夫决策过程,定义环境状态、动作空间、状态转移概率、奖励函数和观测函数;其次,采用循环神经网络构建循环编码器,将机器人的运动时序数据及环境观测时序数据作为输入,输出用于辨识环境差异的元参数;接着,设计评估价值网络、评估策略网络、目标价值网络和目标策略网络,生成控制动作并评估其价值;最后,通过回放记忆存储机器人与环境交互的经验数据,利用时序差分学习更新网络参数,并采用移动平均法更新目标网络参数。本发明通过引入循环编码器,充分利用环境信息的时序特征,增强了机器人在复杂动态环境中的适应性、学习能力和决策准确性,可广泛应用于工业自动化、智能物流、服务机器人等领域。
技术关键词
机器人控制系统 机器人控制方法 编码器 存储机器人 参数 人机交互模块 网络评估策略 决策 算法 输入接口 控制策略 Sigmoid函数 记忆 数据总线 电机驱动单元
系统为您推荐了相关专利信息
1
一种银行用可视化服务终端控制系统及方法
服务终端 人脸识别信息 互动桌面 面部特征 节点
2
一种用户的产品复购情况预测方法及装置
随机森林模型 LightGBM模型 异质 遗传算法 样本
3
一种灯光色温低下的卷烟现场真伪测试方法
反光 低色温 建立卷烟 曲线 相关系数阈值
4
一种改进外观特征处理的行人多目标跟踪方法及系统
轨迹置信度 跟踪方法 跟踪器 轨迹特征 训练检测器
5
电力设备多物理场孪生模型的动态更新方法、装置、设备、存储介质和程序产品
预训练模型 电力设备 样本 油浸式电力变压器 动态更新方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号