摘要
本发明公开了融合时序Transformer与安全约束的自动驾驶行为决策方法,涉及自动驾驶决策技术领域。本发明包括:构建自动驾驶混合交通场景,混合交通场景中包括自动驾驶车辆和人为驾驶车辆;针对混合交通场景中人为驾驶车辆构建人为驾驶车辆模型,其中采用IDM模型控制其纵向决策,采用MOBIL模型控制其横向决策。本发明通过引入代价约束,使得自动驾驶系统在复杂环境下能避免潜在的危险行为,提高安全性;并且通过在策略损失函数中引入动作正则化项,增强了系统在不确定条件下的稳定性,减少了因外部干扰造成的决策错误;同时通过引入transformer时序模型设计网络结构,增强了模型对信息的捕捉能力,提高了决策的有效性。
技术关键词
强化学习模型
决策方法
时序
车辆模型
交通
场景
加速度
策略
方程
双网络结构
自动驾驶系统
决策系统
因子
注意力机制
序列
副本