基于多模态大模型的多粒度视频检索方法、装置、计算机设备及可读存储介质

正文

推荐专利

申请号：CN202510382288

申请日期：2025-03-28

公开号：CN120353962A

公开日期：2025-07-22

类型：发明专利

摘要

本发明公开了一种基于多模态大模型的多粒度视频检索方法、装置、计算机设备及可读存储介质，包括：首先获取用户输入的视频查询信息，进行意图识别得出查询领域，对查询信息和领域重写得到视频查询向量，再依据此向量和领域在预设检索视频知识库中检索，最终获得目标检索视频内容，旨在提升视频检索的效率和准确性，适应多领域检索需求。

技术关键词

检索视频内容编码向量视频检索方法计算机设备分段多模态行人检测视频帧特征意图识别视频检索装置字幕可读存储介质场景文本编码器视频编码器镜头

系统为您推荐了相关专利信息

大语言模型的训练方法及相关装置

大语言模型文本指令组计算机程序产品计算机设备

一种无轴承旋翼柔性梁全三维CT检测方法

CT检测方法柔性无轴承旋翼大梁密度

基于人工智能的有源配网扰动源的定位方法及系统

仿真数据定位方法深度学习模型配网半自动标注方法

基于机器人的操作控制方法、装置、计算机设备及介质

操作控制方法基元计算机可读指令数据标注策略

一种智能电表数据存储方法及系统

智能电表数据存储方法周期初始聚类中心因子

基于多模态大模型的多粒度视频检索方法、装置、计算机设备及可读存储介质

站点导航

APP 下载