基于策略重要性识别和值函数矫正的机器人奔跑控制方法

正文

推荐专利

申请号：CN202410800970

申请日期：2024-06-20

公开号：CN118818976A

公开日期：2024-10-22

类型：发明专利

摘要

本发明提供一种基于策略重要性识别和值函数矫正的机器人奔跑控制方法，涉及机器人控制技术领域。本发明使用当前策略的值函数与行为策略的值函数的差代替选择策略的标准；采用策略重要性对策略进行加权评估，即面对不同的策略时，对每种策略进行动态评估，选取一个对长期回报最优的动作；采用Q函数协同矫正的方式来计算目标Q值，进而对当前策略进行多方面的评估。本发明的方法能有效缓解由OOD引起的高估问题，提高智能体在真实环境下的表现性能以及在新环境下的稳定性和鲁棒性，使智能体能够处理更复杂的机器人奔跑任务，如快速变速、急转弯和跳跃等，提高了机器人的整体任务执行能力。

技术关键词

策略矫正网络机器人控制技术离线代表数据仿真环境关节鲁棒性动态加速度因子偏差矩阵指标算法

系统为您推荐了相关专利信息

一种基于知识图谱和数字孪生的水库智能巡检系统

智能巡检系统水库建模仿真对抗性区块链技术

海洋渔船安全隐患可视化排查与治理系统及方法

海洋渔船三维可视化模型视频监控数据作业场景船舶结构

基于部分卷积和指数移动平均的滑坡检测方法及装置

更新模型参数滑坡检测方法训练集样本滑坡检测装置

一种基于网络包分析的机器人通信状态检测系统及方法

通信状态检测系统报文通信状态检测方法机器人操作系统网络

一种基于FCM-IRBMO-BILSTM的光伏功率短期预测方法

历史气象数据 LSTM模型皮尔逊相关系数多策略超参数

基于策略重要性识别和值函数矫正的机器人奔跑控制方法

站点导航

APP 下载