摘要
本申请公开了强化学习教练驱动的上下文学习通用运动控制方法及系统,该方法包括:接收预定义的多种机器人的结构参数,并在预设参数空间内进行随机采样,生成多个不同结构的机器人;定义目标任务,基于不同结构的机器人,训练每一目标任务对应的强化学习教练;在仿真环境内,利用强化学习教练指导机器人执行任务,并记录与每个目标任务对应的任务执行轨迹;利用通用上下文学习框架从任务执行轨迹中抽取固定长度的上下文序列,以最大化各目标任务下的期望累计奖励为训练目标,进行跨任务元训练,以优化上下文学习模型参数,得到预训练的机器人控制模型;预训练的机器人控制模型;获取由预训练的机器人控制模型输出的与当前状态对应的目标控制动作。
技术关键词
机器人控制
运动控制方法
轨迹
通用运动控制系统
仿真环境
参数
动作噪声
序列
中央处理器
存储器
定义
仿真器
输入输出接口
策略
计算机程序产品
模块
矩阵
指令
系统为您推荐了相关专利信息
追踪方法
Apriori算法
后台数据库
噪声误差
数据可视化
电力负荷预测方法
电力负荷预测模型
二维图像数据
序列
电力负荷预测系统
打磨机器人系统
在线自动控制装置
磁性块
驱动气缸
六轴机械手
轨迹相似性度量
船舶
轨迹聚类算法
预警方法
数据压缩算法
无线充电车位
处理器模块
车辆
无线充电终端
充电线圈