摘要
本申请公开了一种物流管理方法、系统、电子设备及存储介质,所属的技术领域为物流管理技术。所述物流管理方法包括:对环境模拟器的环境状态进行初始化;控制智能体获取环境模拟器的环境状态,以便智能体基于调度策略生成当前动作;根据当前动作更新环境模拟器的环境状态,并更新累积奖励值;若达到终止条件,则基于深度强化学习算法根据累积奖励值调整调度策略;在智能体训练完毕后,对智能体进行部署,并利用智能体对当前环境中的货物进行物流管理。本申请能够实现高效且稳定的物流管理。
技术关键词
物流管理方法
模拟器
控制智能体
深度强化学习算法
物流管理系统
策略
计算机可执行指令
仓库
编码机制
物流管理技术
深度Q网络
电子设备
数值
动态
状态更新
模块
存储器
处理器
系统为您推荐了相关专利信息
动态障碍物
连续动作空间
空气动力学原理
模拟无人机
强化学习框架
深度强化学习算法
决策
数据采集效率
生成方法
生成无人机
性能测试系统
风电变流器
数字信号转换器
数据采集模块
电磁干扰信号
自动化测试用例
副本
生成方法
动态课程
训练智能体