摘要
本申请提供了一种车辆决策方法、装置、车辆和存储介质,该方法应用于车辆领域,该方法包括:通过获取车辆的环境状态参数,将环境状态参数输入至训练好的车辆决策模型,在训练好的车辆决策模型中,动作预测网络会根据环境状态参数和规则数据库输出车辆可能执行的各个候选车辆控制策略,规则数据库中可以预先存有不同环境状态参数下保障车辆安全所要采取的措施,从而动作预测网络能够根据规则数据库做出快速、有指导地决策,之后,价值评估网络会评估每个候选车辆控制策略带来的回报,选择回报最高的候选车辆控制策略作为输出,控制车辆执行该车辆控制策略,保证了所生成决策过程的速度和安全性。
技术关键词
车辆控制策略
车辆决策模型
样本
网络
环境图像数据
可执行程序代码
决策方法
驾驶模拟器
语义分割模型
参数
可读存储介质
符号
风险
存储器
控制单元
计算机
处理器