摘要
本发明公开了一种基于强化学习的自动驾驶车辆高速公路智能变道方法,通过设计一种改进的Huber正则化奖励阈值自适应双深度Q网络(HRA‑DDQN)框架,本发明优化了高速公路自动驾驶决策策略。首先,构建状态空间和动作空间,以描述车辆的动态行为,并引入基于安全性、效率与换道需求的综合奖励函数;其次,通过奖励差异触发的动态目标网络更新机制,提高模型对交通环境变化的适应性;最后,引入结合Huber损失与L2正则化的混合损失函数,以增强模型的鲁棒性和泛化能力。仿真结果表明,本发明显著提升了高速公路场景中自动驾驶车辆的行驶效率和安全性,降低了碰撞率,并优化了换道决策的稳定性,适用于复杂多变的高速公路交通环境。
技术关键词
高速公路智能
变道方法
高速公路场景
周围环境信息
多车道高速公路
深度Q网络
动态交通环境
在线
车辆动力学模型
速度
混合损失函数
信息处理系统
仿真环境
代表
决策
参数
智能网
系统为您推荐了相关专利信息
机器人本体
水冷壁管
控制主板
显示机器人
嵌入式控制器模块
特征提取模块
高速公路场景
夜间高速公路
图像增强模型
微光
周围环境信息
车道
车辆状态信息
换道方法
决策算法
地面机器人
事故现场
信息采集方法
三维全景地图
视觉里程计