摘要
本发明公开了一种基于可持续学习的强化学习自动驾驶决策切换方法及系统,涉及基于可持续学习的强化学习自动驾驶决策切换技术领域,包括创建多场景的决策环境,通过图神经网络搭建决策切换模型,调整决策切换模型中的各个参数,实时获取自动驾驶汽车感知信息中的车辆以及当前场景的信息,对决策切换模型进行可持续学习的设置,自动驾驶汽车驶入未知场景。本发明所述方法通过强化学习动作值函数能够表示该模型对于场景的不确定性的特性,将其动作值函数的倒数作为面对新场景时进行决策切换的标签依据,根据该值能够实现在未知场景中行驶时实现自动对应场景与决策之间的标签联系,并作为决策切换模型针对新场景的训练拟合标签。
技术关键词
决策
切换方法
神经网络参数
标签
辅助学习方法
持续学习方法
车辆
多场景
训练场景
强化学习算法
数据
汽车
注意力机制
策略
状态更新
重构
结构网络
系统为您推荐了相关专利信息
运动轨迹数据
水流
判定方法
参数优化算法
磁性粒子
三元组
大语言模型
信息提取方法
对象
生成知识图谱
档案数据处理
建筑
混合数据库系统
查询算法
数据清洗工具