一种面向高速大雾场景的时序多模态大模型事件理解方法

正文

推荐专利

申请号：CN202510542486

申请日期：2025-04-28

公开号：CN120449007A

公开日期：2025-08-08

类型：发明专利

摘要

本发明涉及智慧交通技术领域，公开了一种面向高速大雾场景的时序多模态大模型事件理解方法，第一步，将高速场景的视频流按照时间顺序拆分为独立的帧序列，并进行数据预处理，第二步，将视频时序数据输入去雾网络进行处理，第三步，将去雾后的视频数据与相关文本数据结合，形成时序+文本的多模态数据输入，第四步，利用双尺度节点描述时序‑语言的层次结构，实现结构对齐，第五步，使用有向边引导时序数据和语言提示之间的逻辑关系，实现逻辑对齐，第六步，将处理后的多模态数据输入事件理解模块，识别并分类场景中的各类事件，实现语义理解。

技术关键词

时序多模态融合机制反射率文本分类场景融合上下文信息数据引入注意力机制智慧交通技术序列视频流语义特征节点深度神经网络视频帧交互机制

系统为您推荐了相关专利信息

一种运维工单的实体关系抽取方法和系统

实体关系抽取模型实体关系抽取方法语义向量实体关系抽取系统词语

一种基于多源数据融合的实时商品价格预测系统

预测商品价格价格趋势预测多源异构数据动态权重分配时序预测模型

基于热词检测的实时网络爬虫框架实现方法及系统

爬虫框架抓取频率数据库存储器分布式爬虫技术过滤模块

一种视频搜索方法、装置及相关设备

关键字文本视频搜索方法标识视频搜索装置

利用AIGC技术优化房产营销策略的方法与系统

人工智能决策个性化推荐系统策略自然语言关联规则挖掘技术

一种面向高速大雾场景的时序多模态大模型事件理解方法

站点导航

APP 下载