摘要
本发明公开了一种基于竞争网络和注意力机制的自动驾驶决策方法,包括步骤:1、使用MDP对自动驾驶决策问题进行建模,将自动驾驶场景抽象为五元组(S,A,P,r,γ),其包括状态空间、动作空间、状态转移概率、奖励函数和折扣因子;2、定义基于MDP的状态空间、动作空间及动作选择问题,包括状态空间细化、动作空间实例化和动作选择问题;3、结合注意力机制网络和强化学习网络,构建出DA‑DDQN,用于求解自动驾驶决策问题;4、在Highway仿真平台的高速公路环境中对网络模型DA‑DDQN进行训练、测试和验证;5、重复迭代步骤4的训练过程,直到策略网络收敛;6、将参数最优的DA‑DDQN应用于自动驾驶车辆,进行自动驾驶决策。本发明能够提高车辆在复杂交通环境中决策的安全性和高效性。
技术关键词
自动驾驶决策方法
注意力机制
强化学习网络
高速公路环境
策略
仿真平台
参数
深度强化学习
深度Q网络
因子
网格特征
自主车辆
舒适度
数据编码
加速度
系统为您推荐了相关专利信息
区域分割方法
燃煤电站锅炉
火焰检测模型
火焰图像特征
燃烧器
土壤温度预测方法
神经网络模型
耦合特征
注意力机制
数据
热水供应控制方法
太阳能集热器
相变蓄热装置
相变蓄热器
热水供应系统
隐私保护方法
注意力机制
隐私保护装置
随机噪声
噪声因子