摘要
本申请提供一种驾驶行为预测方法、装置、设备及存储介质。涉及自动驾驶技术领域。该方法包括:构建虚拟人模型和驾驶模拟环境,将虚拟人模型配置于所述驾驶模拟环境中,使得虚拟人模型与所述车辆模型进行交互,控制车辆模型动作,建立深度学习模型,以根据输入的驾驶员第一人称视角数据,输出控制动作并输出至虚拟人模型,利用训练数据集对深度学习模型进行训练,通过模仿学习与强化学习两个阶段,最大化累计奖励,得到策略函数,并通过与环境信息的交互,使用近端策略优化不断更新策略函数,得到训练后的深度学习模型;利用训练后的深度学习模型实现驾驶行为预测。本申请通过模拟人类驾驶员的决策过程,提升自动驾驶系统的决策能力。
技术关键词
深度学习模型
车辆模型
计算机执行指令
策略
数据
神经网络结构
深度Q网络
特征提取网络
决策
视角
参数
强化学习模型
阶段
人类驾驶员
自动驾驶系统
生成控制指令
自动驾驶技术
可读存储介质
关键点
系统为您推荐了相关专利信息
知识图谱生成方法
气象监测数据
语义
节点
时效性
深度学习模型
语义特征
图像
多尺度
视觉深度学习
故障预测模型
预训练模型
数据传输单元
故障预测方法
时序
逻辑分析方法
姿态估计
建立动作识别模型
实时视频
逻辑分析系统