基于多模态大模型的城市事件检测方法、装置及存储介质

正文

推荐专利

申请号：CN202411878383

申请日期：2024-12-19

公开号：CN119785263A

公开日期：2025-04-08

类型：发明专利

摘要

本申请公开了一种基于多模态大模型的城市事件检测方法、装置及存储介质，涉及计算机应用技术领域。该方法包括：获取公开数据集和城市事件的事件数据集；构建包括视觉编码器、线性投影层和大语言模型在内的多模态识别模型；建立对多模态识别模型的阶段训练方式，并基于公开数据集与事件数据集对多模态识别模型分阶段进行训练；将待测数据输入训练后的多模态识别模型，得到事件识别结果。本申请实施例实现了在城市事件检测过程中减少多模态识别模型数量，提高多模态识别模型迁移学习能力和对新场景的泛化能力、节约多模态识别模型训练时间和资源，使得多模态识别模型的维护和升级过程较为简便的技术效果。

技术关键词

多模态事件检测方法视觉特征事件识别文本大语言模型非易失性计算机可读存储介质线性识别模型训练生成图像数据开源数据库服务器模块模型训练模块存储计算机程序标记数据获取模块摄像设备尺寸

基于多模态大模型的城市事件检测方法、装置及存储介质

站点导航

APP 下载