摘要
本申请提供了一种车辆调度模型训练方法、装置、设备及存储介质,其中,该方法包括:基于初始状态数据进行强化学习,得到第一数据元组,通过对历史调度数据进行转换处理,得到第二数据元组,根据经验回放池中的第一数据元组和第二数据元组确定初始调度模型的损失信息并进行模型的迭代优化,得到目标调度模型。本申请的方法在大规模车辆调度的场景中,可以有效的提升车辆调度方案的生成速度,并且可以实现车辆调度系统的智能化和自主化,具有更好的普适性和更低的成本。
技术关键词
数据
模型训练方法
机器可读指令
仓库
车辆调度系统
节点
模型训练装置
处理器
可读存储介质
贪心策略
计划
电子设备
存储模块
计算机
场景
速度
系统为您推荐了相关专利信息
程序处理方法
虚拟操作系统
电子设备
虚拟化技术
程序处理装置
膳食营养分析仪
食物放置盒
称重器
安装盘
工作台
特征提取网络
数据检测方法
图像
车载互联技术
预测类别