一种基于端到端与多模态大模型的自动驾驶方法及系统

正文

推荐专利

申请号：CN202411956161

申请日期：2024-12-28

公开号：CN120003527A

公开日期：2025-05-16

类型：发明专利

摘要

本申请公开了一种基于端到端与多模态大模型的自动驾驶方法及系统。所述方法包括：确定由目标车辆的多个传感器采集的图像信息、车辆历史信息、导航信息以及文本信息；基于每种信息对应的编码器，分别对图像信息、车辆历史信息、导航信息以及文本信息进行编码，得到多个编码token；将多个编码token分别输入训练好的多模态大语言模型进行预测，得到多个解码token；基于轨迹解码器和文本解码器分别对多个解码token进行解码，并行输出目标车辆的规划轨迹和控制信息；基于规划轨迹和控制信息，控制目标车辆按照规划轨迹自动驾驶，并对当前自动驾驶策略进行文本解释。从而，方案集成度和搭建效率高，泛化性强，迭代性高，适配性强，提高自动驾驶落地与服务效率。

技术关键词

大语言模型多模态训练样本集轨迹解码器自动驾驶方法多层感知机车辆规划图像特征向量三元组参数编码器自动驾驶系统文本编码器图像编码器

系统为您推荐了相关专利信息

一种基于多模态数据融合与深度学习模型的胸痛分类方法及系统

多模态数据融合深度学习模型分类方法胸痛金字塔网络

一种基于Mamba特征融合的目标检测方法

解码器预测类别图像语义特征编码器

视频编解码方法、装置和计算机可读存储介质

计算机程序代码视频解码方法视频编码方法视频编解码方法比特流

一种电网信息作业违规风险检测管控方法及装置

检测管控方法风险评估模型全景视频树状模型视频特征提取

一种图像处理方法和电子设备

图像处理方法实体图像生成模型关系大语言模型

一种基于端到端与多模态大模型的自动驾驶方法及系统

站点导航

APP 下载