一种基于多模态模型进行视频对象搜索的方法

AITNT
正文
推荐专利
一种基于多模态模型进行视频对象搜索的方法
申请号:CN202510380666
申请日期:2025-03-28
公开号:CN119884418A
公开日期:2025-04-25
类型:发明专利
摘要
本发明公开了一种基于多模态模型进行视频对象搜索的方法,基于自研的多模态模型构建了一整套从视频数据预处理、特征提取到多模态融合与匹配的人员搜索流程,能够根据文本输入快速从海量图片(视频)中检索目标对象;使用了先进的多模态技术实现了对视频内容的综合分析和理解,通过结合自然语言描述,视频快速定位的方式提供了自动化的人员识别和定位能力,可以快速、精准地在海量视频中找到目标人物,显著缩短了搜索时间,减少了人工干预,大幅提升了效率和准确性。
技术关键词
多模态 非易失性存储介质 计算机可读指令 对象 视频流 模态技术 机器学习模型 数据 文本 图片 生成向量 信息编码 非机动车 机动车辆 自然语言 电子装置 图像 存储器
系统为您推荐了相关专利信息
1
一种基于视觉的铁路运输的货物装卸装置
货物装卸装置 移动承载平台 中央控制器 采集组件 仿形机械
2
一种基于口内影像的AI增强型实时咬合检测系统
激光扫描设备 口腔内窥镜 压力传感器阵列 多模态数据融合 三维结构
3
合生元组合物及在改善阿尔兹海默症中的应用
菊粉 阿尔兹海默症模型 微生物添加剂技术 微生物菌种保藏 食品组合物
4
基于多模态传感的压力性损伤动态风险评估方法
动态风险评估方法 近红外光谱传感器 LSTM神经网络 多模态 风险评分模型
5
jar包冲突检测方法、装置、存储介质及计算机设备
冲突检测方法 工具平台 识别算法 冲突检测装置 扫描算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号