摘要
本申请公开了一种大语言模型赋能强化学习的自动驾驶汽车行为决策方法及设备,涉及自动驾驶技术领域,该方法包括:利用自动驾驶车载传感器获取汽车状态和环境状态;采用大语言模型,基于汽车状态和环境状态得到行为决策指导策略;基于行为决策指导策略构建策略约束;构建强化学习模型;基于汽车状态和环境状态,并结合策略约束,训练强化学习模型,直至强化学习模型收敛,得到训练好的强化学习模型;采用训练好的强化学习模型,基于实时获得的汽车状态和环境状态得到驾驶行为决策。本申请能够提高自动驾驶汽车行为决策的效率。
技术关键词
强化学习模型
决策方法
大语言模型
汽车
策略
车载传感器
车载雷达传感器
惯性导航传感器
网络
拉格朗日对偶
传播算法
导航定位系统
计算机设备
自动驾驶技术
视觉传感器
计算机程序产品
处理器
构建系统
存储器
系统为您推荐了相关专利信息
电池运行状态
动力电池荷电状态估算方法
样本
监测模块
无线网络
动作识别模型
识别视频片段
图像
动作识别方法
原型
自走式植保机
分布式电驱动
协同控制方法
控制策略模型
协同控制策略