一种车辆变道决策模型训练方法和一种车辆变道决策方法

正文

推荐专利

申请号：CN202410769336

申请日期：2024-06-14

公开号：CN118569097A

公开日期：2024-08-30

类型：发明专利

摘要

本发明公开了一种车辆变道决策模型训练方法和车辆变道决策方法，所述方法包括：获取仿真环境中自车的行驶状态信息，根据行驶状态信息构建马尔科夫决策模型的状态矩阵；将状态矩阵输入强化学习模型进行处理，预测得到状态矩阵对应的行为决策信息；根据行为结果信息和预设的奖励函数确定本次变道任务的奖励得分；将奖励得分、行为决策信息、当前时刻的状态矩阵、下一时刻的状态矩阵，带入损失函数，确定本次任务的损失值；采用外部元学习算法更新强化学习模型的参数进行迭代训练，得到车辆变道决策模型。本方案能够能够在小样本的训练下获得强化学习大量训练数据下的效果，并且能够在不同车流密度、不同路段的变道场景下有很好的泛化能力。

技术关键词

行驶状态信息决策模型训练方法强化学习模型车道车辆加速度矩阵决策方法元学习算法仿真环境交通标志模型训练装置模块电子设备程序处理器指令可读存储介质

系统为您推荐了相关专利信息

一种车辆数据处理方法、装置、电子设备及存储介质

车辆数据处理方法冗余执行器虚拟局域网标识关系

一种模型训练方法、装置及电子设备

声音算法异常声音机械设备数据时间段

一种智能仓库的四向车调度方法及系统

智能仓库四向车订单物流仓储调度技术时间差

一种基于元强化学习的多机器人动态任务规划方法

深度强化学习方法机器人深度强化学习模型训练场景规划算法

一种车路协同路侧单元部署方法

路侧单元部署方法交通安全风险路段背包算法轨迹点数据

一种车辆变道决策模型训练方法和一种车辆变道决策方法

站点导航

APP 下载