一种基于大语言模型和扩散模型的自动驾驶方法与装置

正文

推荐专利

申请号：CN202510358655

申请日期：2025-03-25

公开号：CN120375325A

公开日期：2025-07-25

类型：发明专利

摘要

本发明提供一种基于大语言模型和扩散模型的自动驾驶方法与装置，将所述多视角图像转换为多视角图像特征；将环境查询向量和检测查询向量同所述多视角图像特征进行交互，对多视角图像特征进行压缩并进行映射得到环境编码，减少数据量，加快计算效率；将历史图像特征同所述压缩图像特征进行交互并进行编码映射得到历史编码；将环境编码和历史编码输入至大语言模型中并进行自回归处理，得到轨迹控制编码。一方面引入历史图像特征，以使得对当前车辆的状态有更准确的判断，另一方面将所述轨迹控制编码输入至扩散模型中进行解码，以将文本编码同空间轨迹位置转换对应，实现了将视觉语言模型应用至自动驾驶的轨迹预测中，提高了轨迹预测的准确度。

技术关键词

自动驾驶方法大语言模型多视角图像轨迹注意力计算机程序指令存储库文本自动驾驶装置多模态输出特征对象编码器计算机存储介质解码多层感知机

系统为您推荐了相关专利信息

一种高光谱图像与激光雷达图像融合分类方法及装置

激光雷达图像融合分类方法深度网络模型分支邻域

一种冷轧带钢缺陷在线识别检测方法及系统

识别检测方法深度学习模型冷轧带钢卷积神经网络模型在线

一种基于双层判断的跌倒行为检测方法

场景语义分割网络人体关键点注意力机制高效多尺度

基于实时数据监测的断路器操作单元智能诊断系统

永磁操动机构智能诊断系统实时数据监测电流符号

基于手机识别产品表面微立体结构分布状态以验证产品真伪的方法

产品真伪立体手机摄像头算法像素

一种基于大语言模型和扩散模型的自动驾驶方法与装置

站点导航

APP 下载