一种基于多模态图像的拥挤检测方法及装置

正文

推荐专利

一种基于多模态图像的拥挤检测方法及装置

申请号：CN202510534093

申请日期：2025-04-27

公开号：CN120279491A

公开日期：2025-07-08

类型：发明专利

摘要

本发明公开一种基于多模态图像的拥挤检测方法及装置，涉及目标检测技术领域，本方法通过采集真实地铁场景内摄像头录制的视频，获得初始视频数据，并通过处理构建图像库；通过对设定拥挤程度的图像进行文本描述，并输入文本库，完成文本信息初始化；通过设定卷积神经网络对所述图像库中的图像进行特征提取，获得图像特征向量；通过设定文本编码器对所述文本库中的所述文本信息进行特征提取，获得文本特征向量；通过CLIP多模态模型生成多模态特征表示；设置基础判断参数；基于所述基础判断参数，通过多模态拥挤检测模型对所述多模态特征表示进行检测处理，输出检测结果。本发明能够分区域，快速、准确的对拥挤度识别和检测。

技术关键词

图像特征向量多模态特征文本编码器文本特征向量地铁场景图像库样本图像嵌入视频参数表达式基础模块数据切片关系标签

系统为您推荐了相关专利信息

一种基于视觉语言模型的车辆远程驾驶控制方法和装置

远程驾驶控制方法图像特征向量云端服务器关键帧视觉

一种基于风电功率的业务操作方法、设备及存储介质

风力发电机组长短期记忆网络业务操作方法多信息注意力

基于知识蒸馏的决策生成方法、装置、设备及介质

决策生成方法蒸馏文本特征向量图谱视觉

基于人工智能的深度数据可视化方法、系统及程序产品

数据可视化方法主题关键词可视化图表可视化工具数据可视化系统

电力应急会商环境下的语音识别模型的获取方法、语音识别方法、装置、设备、存储介质和程序产品

样本语音识别模型事件特征音频特征多模态特征

一种基于多模态图像的拥挤检测方法及装置

站点导航

APP 下载