基于分布式鲁棒元强化学习的机器人运动控制方法

正文

推荐专利

申请号：CN202411382585

申请日期：2024-09-30

公开号：CN118876073B

公开日期：2025-01-14

类型：发明专利

摘要

本发明公开了基于分布式鲁棒元强化学习的机器人运动控制方法，包括以下步骤：采样一批任务；对于每一个任务，依据强化学习，用随机初始化的策略采样少量运动轨迹，与环境进行少量交互，对这些运动轨迹进行评估并计算关于策略的梯度，用梯度下降算法对该任务的策略参数进行更新实现快速自适应；更新策略后，用更新后的策略重新采样轨迹进行评估；采用期望尾部风险最小化准则，挑选一部分表现最差的任务进行梯度更新；将优化步骤建模为一个Stackelberg博弈，生成机器人运动控制的学习策略。本申请将分布鲁棒策略简化为一个最大‑最小优化问题，估计其收敛速度。在尾部风险的情况下，建立了与估计分位数之间的联系，提升了鲁棒性。

技术关键词

策略风险梯度下降算法生成机器人轨迹鲁棒性累积分布函数运动分布鲁棒参数仿真环境决策学习器优化器玩家度量地点数据

系统为您推荐了相关专利信息

一种废液收集装置

废液收集装置废液桶夹持手爪机械臂储物盒

一种光储充电站参与配电网负荷恢复服务的方法及系统

光储充电站负荷功率节点储能系统荷电状态

应用评分的确定方法、装置、程序产品以及电子设备

文本标签关键词频率语义分割网络

一种基于多模态数据融合的感染动态可视化评估方法

动态可视化多模态数据融合融合特征空间流行病学风险

一种基于深度学习光储系统无功控制参数协调优化方法和系统

光储系统 BP模型优化BP神经网络深度网络学习协调优化模型

基于分布式鲁棒元强化学习的机器人运动控制方法

站点导航

APP 下载