一种文本视频检索方法、装置、设备和存储介质

AITNT
正文
推荐专利
一种文本视频检索方法、装置、设备和存储介质
申请号:CN202510966694
申请日期:2025-07-14
公开号:CN120892601A
公开日期:2025-11-04
类型:发明专利
摘要
本申请公开一种文本视频检索方法、装置、设备和存储介质,通过获取视频帧序列及其对应的初始文本,对视频帧序列进行采样,得到各段视频帧;生成与初始文本对应的各个文本特征;针对每一段视频帧,对该段视频帧进行视觉编码,生成序列视觉特征集合;对序列视觉特征集合进行全局特征提取,得到全局视觉特征集合;基于序列视觉特征集合、全局视觉特征集合和每一个文本特征,计算相似性分数;根据相似性分数,选取一段或多段视频帧作为目标视频帧。本申请生成与初始文本对应的各个文本特征,同时对各段视频帧进行视觉编码,生成序列视觉特征集合和全局视觉特征集合,即计算相似性分数相比于现有检索方式简单单一的检索方式能够提高检索准确度。
技术关键词
语义关键词 全局视觉特征 视频帧 文本 视频检索方法 全局特征提取 序列 图片 场景 视频检索装置 元素 检索设备 模块 处理器 时序 存储器 连续性 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号