摘要
本发明提供一种基于大模型的粗细粒度相结合的哈希视频检索方法,通过获取视频数据集数据;对视频数据集进行划分和预处理操作;将视频输入分别输入到CLIP帧特征提取模块和Transformer视频特征提取模块;将得到的帧特征信息通过提出的多粒度融合模块中的空间注意力机制进行加权得到帧融合视频信息;将得到的粗粒度视频信息与帧融合视频信息按照给定的特定超参数进行加权融合,最终得到视频信息;将得到的视频信息输入哈希码生成模块中,并通过损失函数,优化网络;将测试样本与数据库中的样本根据汉明距离进行排序,检索到的正确结果。通过采用本发明的技术方案,能够有效增加视频检索的速度,提高视频检索的精度。
技术关键词
视频检索方法
视频特征提取
视频特征信息
样本
汉明距离
注意力机制
特征提取模块
数据
超参数
网络
特征提取器
符号
传播算法
标签
序列
训练集
系统为您推荐了相关专利信息
半球谐振子
振动检测方法
飞机发动机
陀螺仪
气流
机组运行状态
梯度提升模型
新能源发电量
节假日信息
训练样本数据
退火算法
样本
裂缝检测方法
复合标签
匈牙利匹配算法
程度估计方法
全局特征提取
多尺度
sigmoid函数
卷积模块