一种基于可持续学习的强化学习自动驾驶决策切换方法

AITNT
正文
推荐专利
一种基于可持续学习的强化学习自动驾驶决策切换方法
申请号:CN202410891616
申请日期:2024-07-04
公开号:CN118877010A
公开日期:2024-11-01
类型:发明专利
摘要
本发明公开了一种基于可持续学习的强化学习自动驾驶决策切换方法及系统,涉及基于可持续学习的强化学习自动驾驶决策切换技术领域,包括创建多场景的决策环境,通过图神经网络搭建决策切换模型,调整决策切换模型中的各个参数,实时获取自动驾驶汽车感知信息中的车辆以及当前场景的信息,对决策切换模型进行可持续学习的设置,自动驾驶汽车驶入未知场景。本发明所述方法通过强化学习动作值函数能够表示该模型对于场景的不确定性的特性,将其动作值函数的倒数作为面对新场景时进行决策切换的标签依据,根据该值能够实现在未知场景中行驶时实现自动对应场景与决策之间的标签联系,并作为决策切换模型针对新场景的训练拟合标签。
技术关键词
决策 切换方法 神经网络参数 标签 辅助学习方法 持续学习方法 车辆 多场景 训练场景 强化学习算法 数据 汽车 注意力机制 策略 状态更新 重构 结构网络
系统为您推荐了相关专利信息
1
一种基于物理信息神经网络的水流方向判定方法及系统
运动轨迹数据 水流 判定方法 参数优化算法 磁性粒子
2
知识图谱的信息提取方法和计算设备
三元组 大语言模型 信息提取方法 对象 生成知识图谱
3
城市Mesh数据的半监督语义分割方法、装置和设备
语义分割模型 语义分割方法 标签 无监督 噪声
4
一种基于关联查询与聚类分析的历史建筑档案数据处理方法
档案数据处理 建筑 混合数据库系统 查询算法 数据清洗工具
5
面向移动机械臂全身运动规划的优化方法
移动机械臂 末端执行器 关节 规划 运动
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号