针对多车强化学习的决策方法、装置、存储介质及设备

正文

推荐专利

申请号：CN202411867666

申请日期：2024-12-18

公开号：CN119807896A

公开日期：2025-04-11

类型：发明专利

摘要

本申请公开一种针对多车强化学习的决策方法、装置、存储介质及设备，包括：为基于多车强化学习模型控制的每个车辆分配优先级指数；按照优先级指数从高到低的顺序遍历每个车辆；针对遍历的当前车辆，获取多车强化学习模型输出的第i时间步内的探索性动作，判断当前车辆与其他车辆在第i时间步内是否存在碰撞风险；若不存在，则将第i时间步内的探索性动作作为当前车辆在第i时间步内的实际动作；否则基于当前车辆在第i时间步处的安全裕度，从有效动作集合中筛选出当前车辆在第i时间步内的实际动作；将i+1后获得新的i，并返回执行获取第i时间步内探索性动作的步骤，直至确定当前车辆在预设时间范围内每个时间步的实际动作后，继续遍历下一车辆。

技术关键词

强化学习模型车道车辆运动学模型轨迹指数车头决策方法终点风险分配单元存储装置电子设备策略处理器网络模块可读存储介质程序

系统为您推荐了相关专利信息

基于图神经网络的生物制药废水协同处理方法及系统

实时监测数据分子结构信息优化控制策略关系异构

一种基于深度Q网络的网联交叉口生态引导协同控制方法

深度强化学习模型协同控制方法车辆运动规划深度Q网络交叉口

多雷达设备协同控制方法、装置及系统

雷达设备协同控制方法控制服务器协同控制系统显示设备

一种基于语音识别的控制方法

矩阵线性预测倒谱系数音频表达式高通滤波器

一种用于心源性猝死的诊断模型及其构建方法

诊断特征心源性猝死逻辑回归模型计算器构建训练集

针对多车强化学习的决策方法、装置、存储介质及设备

站点导航

APP 下载