摘要
本发明公开了一种深度强化学习辅助进化的超多目标车辆路径规划方法,针对多目标优化与路径规划问题,通过深度强化学习动态引导搜索方向。方法核心包括:1)构建超多目标车辆路径问题数学模型;2)设计深度Q网络作为决策模型,在迭代中自适应选择高潜力搜索方向;3)设计全局搜索策略,平衡全局搜索与局部优化;4)生成子代并评估适应度,执行环境选择更新种群;5)根据种群进化效果计算奖励值,优化DQN网络参数。该方法通过强化学习与进化算法的协同机制,动态调整搜索策略,有效提升算法收敛速度与稳定性,增强对复杂路径规划问题的适应能力,在求解效率、解集质量及动态环境应对方面具有显著优势。
技术关键词
车辆路径规划方法
深度强化学习
回放队列
先进先出队列
梯度下降法
策略
轮盘
决策
数学模型
深度Q网络
定义
变量
进化算法
动态
参数
数据
系统为您推荐了相关专利信息
数据处理方法
进化算法
策略网络模型
学生
深度强化学习
电力系统智能
紧急控制方法
深度强化学习模型
紧急控制策略
故障场景
超参数
降维特征
权重模型
三次样条插值法
随机搜索方法