摘要
本发明公开了一种机器人运动控制方法、装置、设备及可读存储介质,应用于智能控制领域,包括:获取当前机器人状态;基于当前机器人状态,利用运动控制模型,得到下一时刻的控制指令,用于对机器人进行控制;运动控制模型训练时根据状态预测奖励进行参数更新,状态预测奖励根据机器人预测状态和机器人实际状态确定,机器人预测状态基于训练隐变量确定;隐变量为不可观测的随机变量,包括了能对机器人未来状态进行预测的参数。本申请通过状态预测奖励使得机器人运动控制模型对未来机器人状态的预测更接近机器人实际状态,使得产生的下一时刻的控制指令更适于机器人实际状态,从而提高后续对机器人控制的稳定性。
技术关键词
运动控制模型
训练机器人
变量
机器人运动控制
未来机器人
机器人控制
可读存储介质
存储计算机程序
参数
控制模块
处理器
载荷
存储器
周期
模式
系统为您推荐了相关专利信息
散射校正方法
探测器
深度学习网络
掩码矩阵
ADMM算法
交叉注意力机制
特征提取网络
依赖特征
跨模态数据
变量
风电功率预测方法
非线性特征提取
风电功率预测系统
LSTM模型
信息数据处理终端
机器学习模型
变量
归一化植被指数
生态水文
特征值