摘要
本发明提供一种基于深度强化学习的多步态双足运动控制方法及装置,其中,上述方法包括:确定当前人形机器人的状态向量,其中,状态向量包括关节参数、髋部参数以及双腿相位参数;在仿真环境中调用预设的控制策略神经网络基于状态向量,确定预设的控制策略神经网络的输出向量;基于输出向量进行线性变换,得到期望关节角角度;基于期望关节角角度调用比例微分控制器,确定输出力矩;基于输出力矩在仿真环境中模拟人形机器人的轨迹运动,得到轨迹数据的样本数据;当样本数据的数目大于预设的最小样本值时,基于轨迹数据对预设的控制策略神经网络的网络权重进行更新,得到更新后的控制策略神经网络,以控制人形机器人进行期望步态运动。
技术关键词
人形机器人
深度强化学习
运动控制方法
控制策略
比例微分控制器
关节
仿真环境
轨迹
样本
数据
力矩
参数
网络
非暂态计算机可读存储介质
运动控制装置
处理器
控方法
计算机程序产品
模块
系统为您推荐了相关专利信息
深度强化学习模型
气象监测数据
组合特征向量
参数
特征提取器
异常状态
控制策略
对象
计算机设备
深度强化学习模型
建筑物基础
混合损失函数
管控系统
数据价值评估模型
深度强化学习
功能模块
热插拔功能
主控制器
热插拔接口
通信接口单元