摘要
本申请公开了一种机器人系统控制方法、设备、介质及计算机程序产品,涉及机器人技术领域,方法包括:对仿真环境下人工肌肉动力学模型进行基于PID的引导式学习得到的第一训练数据进行数据增强,得到第二训练数据,将两种训练数据存储至经验回放池,依据经验回放池中至少一训练数据对策略网络进行模型训练,将其输出的第一动作向量输入至人工肌肉动力学模型进行动作执行,得到第三训练数据,进行数据增强,得到第四训练数据,将第三训练数据和第四训练数据存储至经验回放池,继续进行模型训练,直至满足预设训练结束条件,得到训练好的策略网络,依据训练好的策略网络中策略参数控制机器人系统运行。本申请可以高效的对机器人系统进行精确控制。
技术关键词
人工肌肉
计算机程序产品
仿真环境
参数
机器人系统控制
数据存储
控制机器人系统
策略
网络
可读存储介质
机器人技术
处理器
存储器
因子
阻尼
系统为您推荐了相关专利信息
智能分配方法
栖息地
生物地理学优化算法
排序策略
动态
集成学习模型
船舶
速度优化方法
油耗
支持向量机模型