摘要
本公开提出了一种反季节着装识别方法、装置、电子设备和存储介质,包括:在公共场所以设定的分辨率和帧率捕获清晰连贯的实时视频,将其分割为单帧图像;对各帧图像进行预处理,设定反季节着装识别的文本提示信息,确保文本提示信息与图像内容具有语义相关性,并将预处理后的图像与设定的文本提示信息构成输入对;构建用于开放目标检测的视觉大模型,将输入对输入视觉大模型中,筛选出的对象区域框作为标注图像进行输出,从而识别是否存在反季节着装的异常行为。本公开能够在复杂的公共安全监控环境中进行精确的目标检测和识别。通过应用视觉大模型,能够深度分析监控图像,准确且高效地识别出反季节着装现象,显著增强了公共场所的安全防范能力。
技术关键词
识别方法
文本
视觉
跨模态
分辨率
公共安全监控
解码器
交叉注意力机制
图像增强
BERT模型
前馈神经网络
图像特征提取
对象
实时视频流
识别模块
计算机
电子设备
系统为您推荐了相关专利信息
光伏组件图像
缺陷检测方法
实时图像
输入神经网络模型
训练神经网络模型
场景三维重建方法
动态物体
图像像素
视觉三维重建技术
图像分割
信息提取模型
推荐多媒体数据
模型训练方法
信息推荐方法
标签
视频特征向量
关键帧
文本特征向量
关键词
文本编码器
层级
地表温度数据
土壤有机碳含量
识别方法
反射率数据