摘要
本发明提出了一种基于优化四足机器人SAC强化学习效率的方法,包括:利用SAC算法优化MPC算法,即模型预测控制算法,引入一种新的优先级方案,以便从经验重放缓冲区中选择更好的样本;混合优先级化的非策略数据和最新的策略内数据,来训练策略,以此实现在线优化耗时减少,解算效率提高。本发明算法可更稳定且效率更高通过测试,从而有效提高四足机器人对复杂场景的适应能力。
技术关键词
四足机器人
模型预测控制算法
SAC算法
MPC算法
策略
样本
在线
离线
数据
网络
度量
场景
系统为您推荐了相关专利信息
缓存调度方法
谷维素
智能仓储
损耗
多维感知数据
多头注意力机制
任务调度方法
编码向量
多层感知器
产线
铁路CTC系统
数据存储优化方法
量子傅里叶变换
云平台
参数