摘要
一种基于多智能体强化学习的异构多机系统动态任务调度方法,包括:1、输入任务信息,将所有任务分解为可供单机器人执行的具有不同能力要求的多个原子任务;2、建立粘连效用评估模型和异构优先级,创建数学优化模型;3、建立局部感知域模型,并基于调度决策点的顺序决策过程,建立马尔科夫决策模型;4、搭建异构多机系统调度环境,结合多种高级训练策略,在环境和智能体的交互中,学习出针对异构多机任务调度的深度强化学习求解器;5、通过深度强化学习求解器,对调度实例在每一调度决策点顺序输出动作,得到动态调度方案。本发明能够对动态事件以插入动态调度决策点的方式处理任务执行过程中的不确定性,实现快速鲁棒的动态任务调度。
技术关键词
动态任务调度方法
机器人
多机系统
深度强化学习
多智能体强化学习
决策
网络
矩阵
代表
启发式规则
关系
元素
全局状态信息
数学
时序
异构系统
复杂度
系统为您推荐了相关专利信息
解剖图像数据
关键特征点
轨迹规划方法
学习机器人
图像分割网络
水下管道
检测机器人
伸缩筒
齿轮保护箱
双向电机
智能巡检机器人系统
智能感知模块
海洋工程
数据处理模块
运动控制模块
智能温控系统
多模态数据采集
隧道窑
装载量
深度强化学习模型