一种基于在线深度强化学习在动态车辆路径优化方法

正文

推荐专利

申请号：CN202411829980

申请日期：2024-12-12

公开号：CN119624302A

公开日期：2025-03-14

类型：发明专利

摘要

本发明公开了一种基于在线深度强化学习的动态车辆路径优化方法，主要解决现有动态车辆路径优化方法动态变化适应能力差、算法实时性差的问题。其实施方案为：1)生成数据集；2)构建决策模型；3)构建并训练策略网络模型和值函数估计网络模型；4)使用训练好的策略网络模型求解带时间窗的动态车辆路径问题。本发明根据车队配送客户的时间顺序建立部分可观测的马尔可夫决策模型，并设计相应的策略网络和值函数估计网络优化车辆路径。训练得到的策略模型可快速给出动态车辆最优路径，并可根据相关条件的动态变化在线调整计划路径，在保证求解质量的同时拥有更快的求解速度，提高了算法在处理动态车辆路径优化问题时的实时性。

技术关键词

节点特征策略网络模型深度强化学习客户构建决策模型动态车辆路径优化生成数据集注意力编码器系统状态信息仓库带时间 Adam算法在线更新模型参数

系统为您推荐了相关专利信息

软件授权验证与订阅管理方法

软件授权验证方法动态密钥摘要订阅管理方法服务器

一种基于预聚合存储表的用户分类方法

客户分类方法轮廓系数 Apriori算法网络爬虫技术

用于装置的低延时控制的系统及方法

低延时装置因特网服务提供商计算机可读媒体队列电缆调制解调器

基于一体化信息模型的客户信息调用方法及系统

信息调用方法缓存策略层级数据项账户

一种基于图神经网络的电力设备拓扑图生成及查询方法

展示设备生成拓扑图查询方法电力设备坐标

一种基于在线深度强化学习在动态车辆路径优化方法

站点导航

APP 下载