摘要
本发明公开了一种基于多智能体强化学习的电动无人驾驶车队多任务联合调度方法:预测出行需求;状态构建;任务候选生成:充电候选、派单候选和调度候选生成;奖励函数设计:包括局部即时奖励设计和全局奖励的构建;价值函数生成;策略改进与Actor更新;环境执行与迭代训练。本发明将补电、订单调度和重定位三项任务视为联合优化问题。设计了基于强化学习中Actor‑Critic架构的任务价值学习机制,结合KM算法实现任务与车辆的最优分配。该算法可持续优化各类任务在不同状态下的价值评估,而KM算法则保障了任务匹配的全局最优性。这种结合使得系统既具备学习能力,又能实时做出最优任务分配决策。
技术关键词
无人驾驶车队
多智能体强化学习
联合调度方法
多任务
策略
车辆
模块
KM算法
出行需求
历史订单数据
充电站信息
决策
仿真平台
仿真环境
网络
网格
数据总线
参数
系统为您推荐了相关专利信息
控制策略
执行控制动作
机械手控制方法
环境状态信息
周围环境信息
发电量
光伏发电站
结算管理方法
管理策略
物联网传感设备
孕妇
融合特征
图像特征提取
时间预测方法
融合策略