摘要
本公开提供一种机器人控制方法、装置和系统,涉及控制领域。机器人控制方法包括:将目标任务拆分为多个子任务;基于物理可达性、时间可达性、多个子任务中每个子任务的紧急度权重、每个子任务与多型异构机器人集合中每个机器人能力的匹配度,在多型异构机器人集合中为目标任务选择候选机器人集合;基于每个子任务的多维度信息和候选机器人集合中每个机器人的多维度信息,构建状态空间向量;基于时间裕度、每个子任务的紧急度权重、每个子任务与候选机器人集合中每个机器人能力的匹配度、和资源效率,构建奖励函数;将状态空间向量输入至强化学习模型,以最大化奖励函数为目标,预测候选机器人集合中每个机器人对每个子任务的动作。
技术关键词
机器人控制方法
异构机器人
强化学习模型
机器人控制装置
机器人控制系统
网络
计算机程序指令
物理
计算机程序产品
处理器
传感器
存储器
资源
因子
可读存储介质
坐标
参数
场景
系统为您推荐了相关专利信息
智能故障诊断方法
故障轴承
生成对抗网络模型
深度强化学习模型
表达式
SCARA机器人
精度检测装置
检测补偿方法
机器人控制系统
光栅组件
智能护理床垫
智能控制模块
强化学习模型
数据采集模块
起背机构
电池组健康状态
充放电策略
强化学习模型
神经网络模型
计算机执行指令
数据处理方法
强化学习模型
知识图谱驱动
地理信息数据
环境监测数据