摘要
本申请属于机器人调度技术领域,尤其涉及一种机器人调度方法、装置、计算机可读存储介质及电子设备。所述方法包括:确定机器人在第一状态下执行选定动作后得到的第二状态;在所述第二状态为目标状态的情况下,确定预设的第一价值模型在所述第二状态下的第一价值输出;其中,所述第一价值模型用于表征由所述目标状态返回至起始状态的过程中的预估奖励值;根据所述第一价值输出对预设的第二价值模型进行更新;其中,所述第二价值模型用于表征各种状态转移所对应的实际奖励值;在完成对所述第二价值模型的更新之后,根据所述第二价值模型对所述机器人进行调度。通过本申请,增加了对于由目标状态返回至起始状态的考虑,有效提高了全局调度效率。
技术关键词
机器人调度方法
模型更新
机器人调度技术
可读存储介质
基础
电子设备
处理器
计算机程序产品
调度装置
因子
模块
存储器
误差
系统为您推荐了相关专利信息
状态机模型
计算机执行指令
蓝牙低功耗设备
蓝牙规范
会话
大语言模型
种子
缺陷检测技术
定位缺陷
计算机程序产品