一种基于多模态大模型的路侧事件理解方法

正文

推荐专利

一种基于多模态大模型的路侧事件理解方法

申请号：CN202510415272

申请日期：2025-04-03

公开号：CN120526400A

公开日期：2025-08-22

类型：发明专利

摘要

本发明提出一种基于多模态大模型的路侧事件理解方法，该方法包括获取实时交通场景图像；基于实时交通场景图像和系统指令利用多模态大模型获得关键区域；基于关键区域和实时交通场景图像利用视觉识别模型生成视觉提示信息，视觉识别模型包括开放世界目标检测模块和地图拓扑结构理解模块；基于实时交通场景图像、系统指令、视觉提示信息利用多模态大模型生成路侧事件信息。利用本发明的方法能够提升路侧事件理解的准确性。

技术关键词

交通场景图像多模态计算机执行指令视觉图像编码器车道图像特征提取理解系统文本编码器多层注意力机制地图拓扑结构信息模块图像获取装置采样器可读存储介质元素

系统为您推荐了相关专利信息

一种水电电力保供智慧管理方法及其系统

水电智慧管理方法逻辑电力会议室

一种多端口投放的优惠券推送方法和装置

优惠券推送方法多端口多模态特征忆阻器阵列策略

一种基于大模型提高机器人3D视觉引导任务性能的方法

雷达探测器梯度下降算法机器人三维视觉图像机器人控制系统

一种基于大数据分析的医用检测装置及其控制方法

医用检测装置分布式传感器网络云端服务器动态权重分配数据采集器

一种五轴运动机构精度优化方法、系统和存储介质

精度优化方法五轴运动机构坐标系标定相机数据处理模块

一种基于多模态大模型的路侧事件理解方法

站点导航

APP 下载