一种基于改进视觉大模型的城市异常事件识别方法

正文

推荐专利

申请号：CN202511026927

申请日期：2025-07-24

公开号：CN120876980A

公开日期：2025-10-31

类型：发明专利

摘要

本发明涉及一种基于改进视觉大模型的城市异常事件识别方法，其包括如下步骤：构建包含N个图像以及与每一图像对应的文本描述的图像数据集；将Grounding DINO模型的图像主干替换为DVT框架，采用语义增强语言模型作为Grounding DINO模型的文本主干，以及在Grounding DINO的跨模态融合模块中引入动态注意力机制；对改进的Grounding DINO模型进行参数调节；以及，利用改进的Grounding DINO模型输出城市异常事件识别结果。本发明通过优化Grounding DINO模型的主干网络和在跨模态融合模块中引入动态注意力机制，使得模型能够更准确地识别各种城市异常事件。

技术关键词

异常事件识别方法样本图像文本参数交叉注意力机制数据分布表达式标签网络分类器语义随机噪声动态视觉优化器框架

系统为您推荐了相关专利信息

机器人示教轨迹优化方法、装置及机器人

采样点机器人示教轨迹优化方法运动终点

基于多级特征增强的远距双目相机标定优化方法

抑制镜面反射双目相机标定对比度双边滤波器多级特征

基于语义的图像识别方法、装置和图像识别系统

训练图像识别模型对象图像识别方法图像识别系统监测系统

文档生成方法、装置、设备和存储介质

机器学习模型文档生成方法模式处理单元文档生成装置

一种双旋转DMS摄像头模组

DMS摄像头模组双轴旋转机构旋转支架阻尼调节装置旋转轴

一种基于改进视觉大模型的城市异常事件识别方法

站点导航

APP 下载