摘要
本发明涉及驾驶换道领域,且公开了一种基于深度强化学习的混合自动驾驶换道决策方法,包括从环境中获取目标车辆及其相邻车辆的观测值信息并输入到DDQN算法的Q‑网络中初步选择一个动作;将该动作通过基于规则的方法进行校验,利用基于规则模型进一步确保学习模型的训练初期的稳定性;使用动态学习的预测模型对校验后的动作执行进行即时风险评估;将最终执行得到的数据经验存储在训练LSTM模型的历史驾驶数据中,不断迭代更新LSTM模型,本发明具备能够综合权衡换道决策的安全性以及最小化对交通流的影响的优点。
技术关键词
换道决策方法
深度强化学习
LSTM模型
车道
交通流
双曲正切函数
加速度
横向位置信息
误差反向传播
网络
自动驾驶系统
更新模型参数
自动车辆
数据
仿真平台
动态
系统为您推荐了相关专利信息
状态预测方法
滞后特征
LSTM模型
待测电池
数据
低压并联电容器
BiLSTM模型
剩余使用寿命预测
充放电次数
预测电容器
高速公路车道
机器学习模型
逻辑
管控方法
矢量图
混合优化算法
排序系统
启发式规则
中央控制模块
遗传算法