一种基于可持续学习的强化学习自动驾驶决策切换方法

正文

推荐专利

申请号：CN202410891616

申请日期：2024-07-04

公开号：CN118877010A

公开日期：2024-11-01

类型：发明专利

摘要

本发明公开了一种基于可持续学习的强化学习自动驾驶决策切换方法及系统，涉及基于可持续学习的强化学习自动驾驶决策切换技术领域，包括创建多场景的决策环境，通过图神经网络搭建决策切换模型，调整决策切换模型中的各个参数，实时获取自动驾驶汽车感知信息中的车辆以及当前场景的信息，对决策切换模型进行可持续学习的设置，自动驾驶汽车驶入未知场景。本发明所述方法通过强化学习动作值函数能够表示该模型对于场景的不确定性的特性，将其动作值函数的倒数作为面对新场景时进行决策切换的标签依据，根据该值能够实现在未知场景中行驶时实现自动对应场景与决策之间的标签联系，并作为决策切换模型针对新场景的训练拟合标签。

技术关键词

决策切换方法神经网络参数标签辅助学习方法持续学习方法车辆多场景训练场景强化学习算法数据汽车注意力机制策略状态更新重构结构网络

系统为您推荐了相关专利信息

一种基于物理信息神经网络的水流方向判定方法及系统

运动轨迹数据水流判定方法参数优化算法磁性粒子

知识图谱的信息提取方法和计算设备

三元组大语言模型信息提取方法对象生成知识图谱

城市Mesh数据的半监督语义分割方法、装置和设备

语义分割模型语义分割方法标签无监督噪声

一种基于关联查询与聚类分析的历史建筑档案数据处理方法

档案数据处理建筑混合数据库系统查询算法数据清洗工具

面向移动机械臂全身运动规划的优化方法

移动机械臂末端执行器关节规划运动

一种基于可持续学习的强化学习自动驾驶决策切换方法

站点导航

APP 下载