摘要
本申请提供了一种多任务调度方法、装置、电子设备及可读存储介质。所述方法包括:将各车辆的当前状态信息、各目的地的信息和物品的信息输入至优化后多智能体强化学习算法,获得优化后多智能体强化学习算法输出的各配送任务以及配送任务的目标车辆,目标车辆执行配送任务获得的反馈值大于其他车辆执行配送任务获得的反馈值;优化后多智能体强化学习算法是利用各目标车辆的历史反馈值优化后获得的,反馈值包括通信连接度和奖励值。本申请通过计算各车辆的通信连接度和执行配送任务的奖励值,以确定最优的执行配送任务的目标车辆,使得更好进行任务调度、分配,实现每个车辆承接与之相适配的配送任务,保障各配送任务完成。
技术关键词
强化学习算法
多任务调度方法
路径损耗指数
噪声功率
任务调度装置
能耗
数据
电子设备
可读存储介质
车辆通信
处理器
时间段
服务器
通信模块
频率
天线
存储器
计算机
系统为您推荐了相关专利信息
数字孪生
执行机构
中央控制器
深度强化学习算法
吊舱
工业信息物理系统
融合网络系统
设备端口
传输调度方法
网络通信设备
检修计划
智能编排方法
电力系统检修
深度强化学习算法
非暂态计算机可读存储介质
光纤通信系统
动态非线性建模
控制执行模块
噪声监测单元
噪声功率谱密度
风险控制模型
识别风险
人工蜂群算法
噪声方差
多传感器管理