摘要
本发明属于自动驾驶技术领域,公开了一种融合先验知识的端到端自动驾驶决策方法,包括:建立车辆控制引导模型;在仿真环境中,利用车辆控制引导模型进行车辆控制,将车辆控制引导模型输出的控制变量作为第一动作变量;并将状态变量与对应的第一动作变量组作为先验经验;利用先验经验对强化学习网络模型进行训练,得到初步训练的强化学习网络模型;利用初步训练的强化学习网络模型控制车辆行驶,并且在判定发生碰撞风险时切换为手动驾驶模式;将初步训练的强化学习网络模型的输出控制变量和手动驾驶模式输出的控制变量存储为第二动作变量;利用状态变量与其对应的第二动作变量对初步训练的强化学习网络模型进行迭代优化,得到自动驾驶决策模型。
技术关键词
强化学习网络
自动驾驶决策方法
融合先验知识
驾驶决策模型
车辆状态信息
交通环境信息
状态编码器
仿真环境
变量
sigmoid函数
车辆控制策略
二自由度模型
注意力机制
车道中心线
自动驾驶技术
特征金字塔
系统为您推荐了相关专利信息
驾驶员疲劳驾驶
行驶环境信息
唤醒系统
面部识别模型
车辆状态信息
辅助驾驶控制方法
智能驾驶控制
中央处理器
车辆状态信息
辅助驾驶控制系统
危险驾驶预警
红外摄像仪
智能穿戴设备
制动系统
异构
非易失性存储器
人工神经网络
控制器
数据
固态驱动器