基于预测轨迹的安全强化学习智能车汇入决策方法及系统

正文

推荐专利

申请号：CN202410990980

申请日期：2024-07-23

公开号：CN118928463A

公开日期：2024-11-12

类型：发明专利

摘要

本申请涉及自动驾驶行为决策技术领域，公开了一种基于预测轨迹的安全强化学习智能车汇入决策方法及系统。构建强化学习汇入决策模型，利用预测模型获取每个动作对应的预测轨迹，基于代价函数计算预测轨迹中每一步状态的代价，利用折现总代价计算方法计算预测轨迹的折现总代价。然后根据每个动作的折现总代价确定安全动作集。若智能体的原始决策动作在安全动作集中，或者安全动作集为空，则输出原始决策动作；若不在安全动作集中，则输出安全动作集中价值最大的动作。本申请中，将预测轨迹融入安全强化学习，通过将不安全动作替换为安全动作，有效地减少了训练过程中的碰撞次数，从而缩短了训练周期，降低了训练成本，提高了汇入决策的安全性。

技术关键词

决策方法智能车轨迹计算方法仿真环境模型训练模块可读存储介质交通决策系统策略处理器输出模块定义存储器计算机电子设备网络因子

系统为您推荐了相关专利信息

一种融合多传感器的园区可视化安全定位实时追踪方法

融合多传感器数字孪生模型追踪方法阶段对象

钢绞线预应力的识别方法、装置、设备及介质

信号特征钢绞线预应力支持向量机回归模型识别方法张拉力

一种基于模态融合和贝塞尔优化的自动驾驶方法

自动驾驶方法控制点轨迹语义时空注意力机制

一种窃电检测方法、系统、电能表及存储介质

窃电检测方法融合计算方法电流值数据处理模块梯度下降算法

一种基于智能优化算法的电网潮流计算方法

电网潮流计算方法负荷智能优化算法节点粒子群算法

基于预测轨迹的安全强化学习智能车汇入决策方法及系统

站点导航

APP 下载