一种基于多模态图像的拥挤检测方法及装置

AITNT
正文
推荐专利
一种基于多模态图像的拥挤检测方法及装置
申请号:CN202510534093
申请日期:2025-04-27
公开号:CN120279491A
公开日期:2025-07-08
类型:发明专利
摘要
本发明公开一种基于多模态图像的拥挤检测方法及装置,涉及目标检测技术领域,本方法通过采集真实地铁场景内摄像头录制的视频,获得初始视频数据,并通过处理构建图像库;通过对设定拥挤程度的图像进行文本描述,并输入文本库,完成文本信息初始化;通过设定卷积神经网络对所述图像库中的图像进行特征提取,获得图像特征向量;通过设定文本编码器对所述文本库中的所述文本信息进行特征提取,获得文本特征向量;通过CLIP多模态模型生成多模态特征表示;设置基础判断参数;基于所述基础判断参数,通过多模态拥挤检测模型对所述多模态特征表示进行检测处理,输出检测结果。本发明能够分区域,快速、准确的对拥挤度识别和检测。
技术关键词
图像特征向量 多模态特征 文本编码器 文本特征向量 地铁场景 图像库 样本 图像嵌入 视频 参数 表达式 基础 模块 数据 切片 关系 标签
系统为您推荐了相关专利信息
1
一种基于视觉语言模型的车辆远程驾驶控制方法和装置
远程驾驶控制方法 图像特征向量 云端服务器 关键帧 视觉
2
一种基于风电功率的业务操作方法、设备及存储介质
风力发电机组 长短期记忆网络 业务操作方法 多信息 注意力
3
基于知识蒸馏的决策生成方法、装置、设备及介质
决策生成方法 蒸馏 文本特征向量 图谱 视觉
4
基于人工智能的深度数据可视化方法、系统及程序产品
数据可视化方法 主题关键词 可视化图表 可视化工具 数据可视化系统
5
电力应急会商环境下的语音识别模型的获取方法、语音识别方法、装置、设备、存储介质和程序产品
样本 语音识别模型 事件特征 音频特征 多模态特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号