一种基于端到端与多模态大模型的自动驾驶方法及系统

AITNT
正文
推荐专利
一种基于端到端与多模态大模型的自动驾驶方法及系统
申请号:CN202411956161
申请日期:2024-12-28
公开号:CN120003527A
公开日期:2025-05-16
类型:发明专利
摘要
本申请公开了一种基于端到端与多模态大模型的自动驾驶方法及系统。所述方法包括:确定由目标车辆的多个传感器采集的图像信息、车辆历史信息、导航信息以及文本信息;基于每种信息对应的编码器,分别对图像信息、车辆历史信息、导航信息以及文本信息进行编码,得到多个编码token;将多个编码token分别输入训练好的多模态大语言模型进行预测,得到多个解码token;基于轨迹解码器和文本解码器分别对多个解码token进行解码,并行输出目标车辆的规划轨迹和控制信息;基于规划轨迹和控制信息,控制目标车辆按照规划轨迹自动驾驶,并对当前自动驾驶策略进行文本解释。从而,方案集成度和搭建效率高,泛化性强,迭代性高,适配性强,提高自动驾驶落地与服务效率。
技术关键词
大语言模型 多模态 训练样本集 轨迹 解码器 自动驾驶方法 多层感知机 车辆 规划 图像特征向量 三元组 参数编码器 自动驾驶系统 文本编码器 图像编码器
系统为您推荐了相关专利信息
1
一种基于多模态数据融合与深度学习模型的胸痛分类方法及系统
多模态数据融合 深度学习模型 分类方法 胸痛 金字塔网络
2
一种基于Mamba特征融合的目标检测方法
解码器 预测类别 图像 语义特征 编码器
3
视频编解码方法、装置和计算机可读存储介质
计算机程序代码 视频解码方法 视频编码方法 视频编解码方法 比特流
4
一种电网信息作业违规风险检测管控方法及装置
检测管控方法 风险评估模型 全景视频 树状模型 视频特征提取
5
一种图像处理方法和电子设备
图像处理方法 实体 图像生成模型 关系 大语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号