摘要
本申请提供一种自动驾驶行为决策方法、驾驶决策设备和可读存储介质,涉及自动驾驶技术领域。本申请通过调用基于自适应动态规划技术训练得到的驾驶行为策略网络和驾驶代价评估网络,基于目标车辆的实时驾驶环境状态进行蒙特卡洛树搜索,以将自适应动态规划技术融入到蒙特卡洛树搜索算法的各个决策阶段,指导蒙特卡洛树搜索算法聚焦于对高价值决策的有效搜索,降低无效搜索的工作量、计算资源损耗负担和时间损耗,提高蒙特卡洛树搜索算法的决策效率和决策准确性,从而快速且可靠地决策出目标车辆在当前时刻于复杂驾驶环境下的最优驾驶动作,以便在考虑其他交通参与者的复杂驾驶环境下实现快速、鲁棒性好且决策解释性强的驾驶行为决策功能。
技术关键词
网络
蒙特卡洛树搜索
节点
决策方法
动态规划技术
搜索算法
策略
动作噪声
车辆
自动驾驶技术
基准
因子
处理器
样本
计算机设备
系统为您推荐了相关专利信息
晶体管布局方法
标准单元电路
图论算法
晶体管布局装置
电子设备
设备故障报警系统
智能优化算法
磁场强度传感器
监测模块
卷积神经网络算法
染色质开放区
融合多尺度特征
玉米
数据输出模块
输入多尺度
关键点特征
交叉注意力机制
交互注意力
对象
查询标签