摘要
本申请涉及智能交通技术领域,提供了一种基于强化学习的车辆决策优化方法及相关设备。本申请的方法包括:获取多个变道车辆的变道数据;基于所有变道数据从所有变道车辆中确定出进行危险变道行为的目标变道车辆;利用强化学习模型,基于所有目标变道车辆的变道数据获取每个目标变道车辆的预测变道动作,并计算预测变道动作对应的奖励值;基于所有奖励值对强化学习模型进行优化,得到优化后的强化学习模型;利用优化后的强化学习模型获取目标车辆的最终变道动作,并根据最终变道动作控制目标车辆进行变道。本申请的方法能够提高自动驾驶车辆决策的准确性。
技术关键词
决策优化方法
强化学习模型
车道
车辆后方
指标
数据
智能交通技术
加速度
可读存储介质
处理器
优化装置
终端设备
存储器
计算机
控制模块
风险
系统为您推荐了相关专利信息
预警方法
三维模型
数值
多视影像密集匹配
三维点云数据
风险决策方法
实时业务
时序特征
机器学习模型
指标
执行器
通信组件
分布式训练
注册算法
调度器组件
梯度提升模型
性能评价方法
线性回归模型
随机森林模型
因子