摘要
本申请实施例提供一种机器人运动控制方法和设备,该方法包括将第一历史数据输入训练好的特征提取网络,获得第一特征数据,第一特征数据包括地形特征和/或行为特征,将当前第一动作指令、第一特征数据和第二历史数据输入训练好的策略网络,获得当前第一动作,训练好的策略网络是基于特征提取网络、策略网络和对抗评价网络所构成的融合框架,根据强化学习算法对策略网络进行训练获得的,根据当前第一动作,确定对应的当前第一力矩,根据当前第一力矩驱动机器人执行当前第一动作。本实施例的方法,只需结合少量专家数据集就可以很轻松的训练得到策略网络实现类人运动,提高了行为风格的模仿质量。
技术关键词
机器人运动控制方法
特征提取网络
策略
机器人运动控制设备
地形特征
动作输入机器人
强化学习算法
计算机执行指令
数据
风格
力矩
表达式
代表
多层感知机
框架
解码器
样本
编码器
系统为您推荐了相关专利信息
布局优化方法
粒子群更新算法
热点
智能基站
信号
教育评估系统
评估工作流
数据处理架构
个性化学习路径
差分隐私
巡航控制方法
模型预测控制器
车辆运动学模型
协作关系
车辆后部区域
节点
工业物联网
数据处理系统
多模态
数据处理模块