一种基于多模态模型进行视频对象搜索的方法

正文

推荐专利

申请号：CN202510380666

申请日期：2025-03-28

公开号：CN119884418A

公开日期：2025-04-25

类型：发明专利

摘要

本发明公开了一种基于多模态模型进行视频对象搜索的方法，基于自研的多模态模型构建了一整套从视频数据预处理、特征提取到多模态融合与匹配的人员搜索流程，能够根据文本输入快速从海量图片（视频）中检索目标对象；使用了先进的多模态技术实现了对视频内容的综合分析和理解，通过结合自然语言描述，视频快速定位的方式提供了自动化的人员识别和定位能力，可以快速、精准地在海量视频中找到目标人物，显著缩短了搜索时间，减少了人工干预，大幅提升了效率和准确性。

技术关键词

多模态非易失性存储介质计算机可读指令对象视频流模态技术机器学习模型数据文本图片生成向量信息编码非机动车机动车辆自然语言电子装置图像存储器

系统为您推荐了相关专利信息

一种基于视觉的铁路运输的货物装卸装置

货物装卸装置移动承载平台中央控制器采集组件仿形机械

一种基于口内影像的AI增强型实时咬合检测系统

激光扫描设备口腔内窥镜压力传感器阵列多模态数据融合三维结构

合生元组合物及在改善阿尔兹海默症中的应用

菊粉阿尔兹海默症模型微生物添加剂技术微生物菌种保藏食品组合物

基于多模态传感的压力性损伤动态风险评估方法

动态风险评估方法近红外光谱传感器 LSTM神经网络多模态风险评分模型

jar包冲突检测方法、装置、存储介质及计算机设备

冲突检测方法工具平台识别算法冲突检测装置扫描算法

一种基于多模态模型进行视频对象搜索的方法

站点导航

APP 下载