摘要
本发明涉及机器人领域,公开了一种机器人的控制方法、装置、设备及存储介质。包括搭建机器人的仿真环境和仿真控制系统,并对操作任务进行动作拆分得到动作集合,采集机器人在执行动作集合过程中的关节动作图像和关节动作位置生成状态空间,基于状态空间和奖励函数训练强化得到智能体模型,利用预设损失函数对智能体模型进行优化,基于机器人在任务环境中的当前状态空间利用智能体模型预测机器人的目标动作空间,并控制机器人执行对应的动作。本方案通过在仿真环境中训练智能体模型,预测机器人下一时刻的动作,实现在真实环境中对机器人的控制,避免了机器人只能通过在实际物理环境中不断训练与试错带来的设备磨损等实验成本问题。
技术关键词
智能体模型
仿真控制系统
仿真环境
彩色图像
关节
预测机器人
控制设备
训练智能体
可读存储介质
搭建模块
存储器
处理器
指令
物体
解码器
计算机
系统为您推荐了相关专利信息
GCN模型
关节点
轨道交通驾驶员
城市轨道交通列车
骨骼特征
流水线分拣装置
机器人视觉
传送组件
图像采集器
垃圾
训练优化方法
阵列传感器
大数据
身体
数据采集模块
高精度机器人
重复性
标记单元
数据采集单元
偏差
阀门把手
关键点
异常识别方法
巡检机器人
多尺度特征提取方法