基于多模态大模型的自动驾驶协同感知方法及装置

正文

推荐专利

申请号：CN202410771385

申请日期：2024-06-14

公开号：CN118887632A

公开日期：2024-11-01

类型：发明专利

摘要

本发明提供一种基于多模态大模型的自动驾驶协同感知方法及装置，该方法包括：通过多模态大模型对主端车辆的点云数据进行处理，得到文本信息；从文本信息中提取文本特征，从主端车辆的图像数据中提取图像特征，从点云数据对应的深度图中提取深度图特征；根据文本特征对深度图特征和图像特征进行融合，得到第一融合特征；对第一融合特征和目标端发送的待检测物体特征进行融合，得到第二融合特征；目标端包括主端车辆的协同端和路端中的至少一项；基于第二融合特征执行多端协同感知视觉任务。本发明所述方法提高了感知特征的表征能力，进而提高了多终端车辆间的协同感知准确率和鲁棒性。

技术关键词

协同感知方法深度图融合特征多模态文本车辆图像数据协同感知装置非暂态计算机可读存储介质点云物体处理器多层感知器特征提取模块感知特征计算机程序产品视觉存储器

系统为您推荐了相关专利信息

基于大模型的文本分析方法、装置及电子设备

结构化查询语言文本分析方法规划自然语言数据

基于混合注意力监督U型网络MRI图像分割系统及方法

多模态MRI图像图像分割系统注意力编码模块多层感知机

一种基于知识图谱的自动派单推荐整合系统

动态知识图谱资源调度优化规则推理引擎神经网络推理跨模态数据

面向应用程序接口推荐的多领域特征融合方法及装置

视角训练参数集矩阵特征融合方法上存储计算机程序

一种运维根因分析系统、方法、介质及设备

大语言模型数据分析工具分发模块工单系统分析模块

基于多模态大模型的自动驾驶协同感知方法及装置

站点导航

APP 下载