摘要
本发明提供一种运行控制模型训练方法、机器人运行控制方法和系统,其中方法包括:根据仿真机器人的第一样本状态信息和各动作任务对应的奖励函数,分别对初始策略网络进行强化学习训练,得到各动作任务对应的目标策略网络;根据仿真机器人的第二样本状态信息、预设训练任务对应的任务标签,以及各动作任务对应的目标策略网络输出的第二样本状态信息对应的期望动作信息,对初始运行控制模型进行迁移学习、强化学习训练和模仿学习的联合训练;根据训练后的初始运行控制模型,构建运行控制模型。本发明实现通过多训练任务的联合训练,可实现机器人的多任务兼容处理的同时,保证机器人不同动作任务之间的平滑切换,有效提高了机器人运行控制的性能。
技术关键词
控制模型训练方法
仿真机器人
实体机器人
样本
策略
机器人运行控制系统
网络
标签
非暂态计算机可读存储介质
模型训练系统
机身
运动
关节力矩
命令
处理器
速度
动态更新
能耗
系统为您推荐了相关专利信息
试验机液压系统
能效评估模型
优化控制方法
压剪试验机
强化学习算法
调频方法
混合整数规划模型
鲁棒优化算法
事件驱动机制
李雅普诺夫函数