摘要
本申请实施例提供了一种基于深度强化学习的充电调度方法、装置、设备及介质,属于人工智能技术领域。该方法包括:获取充电需求信息和设备资源信息;当待选车辆未选完时,从多个待选充电设备中选定目标充电设备,并确定目标充电设备对应的目标充电动作,其中,目标充电动作包括向内充电和向外充电中的一种;若目标充电动作为向外充电,从剩余的多个待选车辆中,基于当前的充电需求信息和设备资源信息为目标充电设备选定对应的目标车辆,并更新对应的设备资源信息和充电需求信息;直至所有待选车辆选完时,基于每一目标充电设备下的多个目标充电动作的选定顺序生成对应的目标充电序列。本申请能够提高对智能充电机器人的充电调度效率。
技术关键词
充电设备
样本
深度强化学习模型
累计工作时间
充电调度方法
车辆
序列
资源
智能充电机器人
解码器
注意力机制
编码器参数
可读存储介质
人工智能技术
调度装置
电能
电子设备
处理器