摘要
本申请公开了一种基于端到端与多模态大模型的自动驾驶方法及系统。所述方法包括:确定由目标车辆的多个传感器采集的图像信息、车辆历史信息、导航信息以及文本信息;基于每种信息对应的编码器,分别对图像信息、车辆历史信息、导航信息以及文本信息进行编码,得到多个编码token;将多个编码token分别输入训练好的多模态大语言模型进行预测,得到多个解码token;基于轨迹解码器和文本解码器分别对多个解码token进行解码,并行输出目标车辆的规划轨迹和控制信息;基于规划轨迹和控制信息,控制目标车辆按照规划轨迹自动驾驶,并对当前自动驾驶策略进行文本解释。从而,方案集成度和搭建效率高,泛化性强,迭代性高,适配性强,提高自动驾驶落地与服务效率。
技术关键词
大语言模型
多模态
训练样本集
轨迹
解码器
自动驾驶方法
多层感知机
车辆
规划
图像特征向量
三元组
参数编码器
自动驾驶系统
文本编码器
图像编码器
系统为您推荐了相关专利信息
多模态数据融合
深度学习模型
分类方法
胸痛
金字塔网络
计算机程序代码
视频解码方法
视频编码方法
视频编解码方法
比特流
检测管控方法
风险评估模型
全景视频
树状模型
视频特征提取
图像处理方法
实体
图像生成模型
关系
大语言模型