一种基于高效率注意力机制的视频检索特征提取方法

正文

推荐专利

申请号：CN202510759903

申请日期：2025-06-09

公开号：CN120673312A

公开日期：2025-09-19

类型：发明专利

摘要

本发明公开了一种基于高效率注意力机制的视频检索特征提取方法，属于计算机视觉领域。包括如下步骤：构建基于高效率注意力机制的带有语义感知的特征网络；获取图像训练样本和文本图像对的训练样本；利用基于图像数据随机增强的自监督学习方法预训练得到图像特征编码器；利用基于图像文本对的跨模态语义的自监督学习方法预训练到图像语义特征编码器；对两个编码器进一步联合训练，得到最终的用于短视频检索的视频特征提取网络，将待查询视频抽帧并将视频帧输入视频特征提取网络，即可提取视频图像的特征。本发明可以在大幅度提高短视频检索工作的视频特征提取效率的前提下，保证特征网络兼顾视频画面的浅层细节特征和时间语义特征，提高检索的最终性能。

技术关键词

图像训练样本注意力机制语义特征特征提取方法高效率监督学习方法视频特征提取文本编码器网络视频帧短视频三元组特征提取系统损失函数优化编码器训练

系统为您推荐了相关专利信息

音频鉴伪方法及相关装置、设备和存储介质

音频特征样本鉴伪方法重构模型特征提取模型

一种基于多源数据分析的车用电池健康状态的检测方法及系统

车用电池注意力机制增量学习算法融合网络架构交互注意力

一种基于扩散对齐的大模型检索增强生成方法和系统

语义向量实体编码向量文本生成方法

一种连铸夹杂物分析与控制方法、装置和程序产品

时间滑动窗口联合优化方法数据处理流水线决策树模型动态更新

一种车辆控制方法、装置及设备

动作识别模型车辆控制方法回波飞行时间传感器车辆控制设备

一种基于高效率注意力机制的视频检索特征提取方法

站点导航

APP 下载