摘要
本发明公开了一种深度强化学习的多式联运路径优化方法,属于物流管理领域,包括以下步骤S1.形成从起点到终点的多条可行路径作为训练样本,计算每条子路径的运输时间、运费成本、碳排放量、事故发生率和最大载重指标作为对应可行路径的质量评价指标;S2.基于状态空间、动作空间及奖励函数构建深度强化学习智能体;S3.智能体采用Sum Tree优先采样机制选择样本,生成最优路径;S4.联运过程中,监控路径的质量评价指标,根据实时路径状态数据动态生成最优路径。本发明能适应实时交通变化等动态因素,减少人工干预,对突发事件响应效率高,可减少意外事故的发生概率,降低碳排放量和其他污染物的排放。
技术关键词
联运路径优化方法
深度强化学习
指标
样本
业务请求信息
排放量
网络拓扑模型
机制
矩阵
时序
表达式
变量
误差
终点
索引
策略
动态更新
因子
系统为您推荐了相关专利信息
优化小波神经网络
粒子群算法
粒子群小波神经网络
板材
粒子群优化神经网络
数字孪生体
识别检测方法
多模态
基元
多光谱成像设备
全卷积神经网络
采样模块
特征提取模块
卷积模块
影像
海上风电机组
故障告警信息
风电机组变流器
故障检测方法
历史故障信息