摘要
本发明适用于智能驾驶技术领域,提供了一种带有补偿反馈的多模态强化学习车辆决策规划方法,包括以下步骤:强化学习交互环境设计;环境状态的多模态融合;奖励函数设计;构建深度强化学习模型;设计局部轨迹规划器反馈机制。本发明结合了多模态学习和补偿反馈机制,旨在提高学习效率,同时确保决策的安全性和鲁棒性。通过该方法,即使在复杂的交通环境中,自动驾驶车辆也能够做出准确、高效的决策。
技术关键词
决策规划方法
轨迹规划器
深度强化学习模型
SAC算法
智能车辆
车道
车辆碰撞传感器
策略
偏角
车辆碰撞信息
补偿值
速度
深度学习架构
网络
智能驾驶技术
车辆状态信息
标志