基于图文匹配的视频片段检索方法、装置、设备及介质

正文

推荐专利

申请号：CN202411570195

申请日期：2024-11-05

公开号：CN119622021A

公开日期：2025-03-14

类型：发明专利

摘要

本申请提供一种基于图文匹配的视频片段检索方法、装置、设备及介质，涉及视频检索技术领域。本申请方法通过将视频数据切分成多个视频块并分别提取特征，增强了对视频内容的细粒度理解，从而提高了检索的准确性。利用特征编码模型对检索文本和视频块进行编码处理，加深了文本描述与视频内容之间的语义关联，从而提升匹配的准确性。通过多头多尺度检测算法对视频块进行检索，可以多维度地评估视频块与文本的匹配度，提高了匹配的准确性。通过对比学习算法计算视频块与文本的特征相似度，并选择相似度最高的视频块作为目标视频片段，能够确保最终检索结果的精确度，从而显著提升了视频片段检索的准确性和效率。

技术关键词

视频片段检索方法多尺度检测算法视频块特征编码模型文本加权损失函数图文标签学习算法注意力长度尺寸检索装置视频检索技术前馈神经网络计算机设备可读存储介质加权算法

系统为您推荐了相关专利信息

基于多元知识混合检索增强的药物不良反应事件识别方法和系统

药物不良反应事件识别方法实体大语言模型概念

数据处理方法、装置、设备以及存储介质

规则知识库审核模型文本条目数据处理方法

基于粗细粒度特征融合的多模态虚假新闻检测方法及系统

细粒度特征融合特征多粒度特征编码器训练图文

网络设备配置的管理方法、装置、电子设备及存储介质

网络设备配置管理方法实时数据语义配置文件管理

基于大语言模型的可解释建筑能耗预测方法及系统

建筑能耗预测方法大语言模型多头注意力机制建筑能耗预测系统生成时间序列数据

基于图文匹配的视频片段检索方法、装置、设备及介质

站点导航

APP 下载