基于强化学习的车辆路径规划方法及装置

正文

推荐专利

基于强化学习的车辆路径规划方法及装置

申请号：CN202511285720

申请日期：2025-09-10

公开号：CN120800422B

公开日期：2025-11-21

类型：发明专利

摘要

本发明提供基于强化学习的车辆路径规划方法及装置，涉及数据处理技术领域，方法包括：将t时间步的状态向量输入至第一模型中，获取第一样本动作对应的第一预期收益值；选取目标第一样本动作，更新得到t+1时间步的状态向量；将t+1时间步的状态向量输入至第二模型中，获取多个第二样本动作以及对应的第二预期收益值；基于第二预期收益值确定目标预期收益值，基于目标预期收益值、目标第一样本动作对应的第一预期收益值确定训练损失，基于训练损失更新第一模型的参数；在多个时间步后基于第一模型的参数对第二模型的参数进行软更新；基于训练完成后的第一模型的输出数据得到车辆路径规划结果。本发明可以提高车辆路径规划的鲁棒性。

技术关键词

车辆路径规划方法样本车辆路径规划装置非暂态计算机可读存储介质参数处理器数据处理技术计算机程序产品输出模块存储器鲁棒性序列电子设备规模机制

系统为您推荐了相关专利信息

一种工业机器人控制方法

机器人高精度位置传感器偏差初始化系统粒子群优化算法

一种面向产品包装生产线的数字孪生仿真与优化系统

产品包装生产线参数监测设备设备运行数据动态

一种针对航天器目标类型与属性分类的图像标注方法

图像标注方法航天器模板基准标签体系

一种基于环境光度的车载显示屏色彩校准方法及系统

色彩校准方法屏幕显示模块车载显示屏数据神经网络模型

医疗系统的人机交互方法、装置、医疗系统和存储介质

信息显示界面医疗系统人机交互方法显示背景图像标识

基于强化学习的车辆路径规划方法及装置

站点导航

APP 下载