摘要
本申请提供了一种机器人的控制方法、装置、介质和系统。该方法通过采用马尔可夫决策过程技术生成策略价值函数、状态价值函数和动作价值函数,动作为以下之一:正常移动、成功避障、打滑、搬移、倾覆、碰撞,从而将复杂的工况纳入考量,迭代更新贝尔曼方程,直到贝尔曼方程收敛为止或者直到当前迭代次数等于预设迭代次数为止,以确定最佳控制策略,并采用最佳控制策略控制机器人移动,使得本申请相比现有方案能够针对复杂工况对机器人进行有效控制,从而解决了现有方案对于机器人的控制无法应用于较为复杂的工况,从而导致针对复杂工况对于机器人的控制效果较差的问题。
技术关键词
机器人
控制策略
方程
启发式搜索算法
最佳运动路径
可读存储介质
处理单元
采集设备
决策
音频传感器
碰撞传感器
工况
检测传感器
湿度传感器
正面
程序
计算机
里程计
温度传感器