基于分布式鲁棒元强化学习的机器人运动控制方法

AITNT
正文
推荐专利
基于分布式鲁棒元强化学习的机器人运动控制方法
申请号:CN202411382585
申请日期:2024-09-30
公开号:CN118876073B
公开日期:2025-01-14
类型:发明专利
摘要
本发明公开了基于分布式鲁棒元强化学习的机器人运动控制方法,包括以下步骤:采样一批任务;对于每一个任务,依据强化学习,用随机初始化的策略采样少量运动轨迹,与环境进行少量交互,对这些运动轨迹进行评估并计算关于策略的梯度,用梯度下降算法对该任务的策略参数进行更新实现快速自适应;更新策略后,用更新后的策略重新采样轨迹进行评估;采用期望尾部风险最小化准则,挑选一部分表现最差的任务进行梯度更新;将优化步骤建模为一个Stackelberg博弈,生成机器人运动控制的学习策略。本申请将分布鲁棒策略简化为一个最大‑最小优化问题,估计其收敛速度。在尾部风险的情况下,建立了与估计分位数之间的联系,提升了鲁棒性。
技术关键词
策略 风险 梯度下降算法 生成机器人 轨迹 鲁棒性 累积分布函数 运动 分布鲁棒 参数 仿真环境 决策 学习器 优化器 玩家 度量 地点 数据
系统为您推荐了相关专利信息
1
一种废液收集装置
废液收集装置 废液桶 夹持手爪 机械臂 储物盒
2
一种光储充电站参与配电网负荷恢复服务的方法及系统
光储充电站 负荷 功率 节点 储能系统荷电状态
3
应用评分的确定方法、装置、程序产品以及电子设备
文本 标签 关键词 频率 语义分割网络
4
一种基于多模态数据融合的感染动态可视化评估方法
动态可视化 多模态数据融合 融合特征 空间流行病学 风险
5
一种基于深度学习光储系统无功控制参数协调优化方法和系统
光储系统 BP模型 优化BP神经网络 深度网络学习 协调优化模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号