一种基于多模态大模型的端到端交通道路状态感知方法

正文

推荐专利

申请号：CN202510017064

申请日期：2025-01-06

公开号：CN119964101A

公开日期：2025-05-09

类型：发明专利

摘要

本发明公开了一种基于多模态大模型的端到端交通道路状态感知方法，包括：采集交通视频数据集和交通文本数据集；提取至少部分交通视频数据的每帧图像并特征提取得到交通特征；基于交通要素集对每帧图像进行标注；对交通文本数据集进行清洗、分词和标记化；统计第一比值和第二比值，从而计算联合概率；基于联合概率判断交通要素和交通特征是否关联；基于关联的交通要素和交通特征，利用滑动窗口对清洗后的交通文本数据集进行提取，得到训练样本；对大语言模型进行预训练，得到预训练大语言模型；对感知大模型进行训练；将待输入视频图像输入至训练后的感知大模型中得到场景理解文本。本发明同时实现精准目标检测和路网状态的文本描述。

技术关键词

交通视频数据状态感知方法交通道路交通特征大语言模型多模态文本图像编码器滑动窗口表达式词语分词网络结构场景优化器批量

系统为您推荐了相关专利信息

基于大语言模型的少数类样本生成方法、系统及存储介质

大语言模型情感分类模型样本生成方法训练样本数据文本

一种针对文本到视频生成的检索增强提示词优化方法

分支数据分布计算机存储介质文本视频

一种提示注入防御方法、系统、电子设备及存储介质

大语言模型文本语义语法结构序列

模型训练文件读存系统，及基于模型训练文件读存系统的模型训练文件读存方法、装置、设备、介质和产品

大语言模型进程分块存储器流水线

一种基于时空约束的旅游方案推荐方法及装置

语义向量场景推荐方法自然语言理解可读存储介质

一种基于多模态大模型的端到端交通道路状态感知方法

站点导航

APP 下载