摘要
本申请公开了一种基于深度学习的视频语义检索方法、装置、设备和介质,一般涉及计算机技术领域。该方法包括:接收视频文件并通过目标模型分解所述视频文件,确定所述视频文件中的目标帧和目标音频;将所述目标帧和所述目标音频解析为多维度向量信息;通过目标模型将所述视频文件中的多维度向量信息转化为单一维度向量信息;将所述单一维度向量信息存储至目标数据库中;通过所述目标数据库中的预设向量信息与所述单一维度向量信息进行比对分析,并在所述预设向量信息与所述单一维度向量信息相匹配的情况下,确定所述视频文件为目标文件。在保证确定目标文件正确率的同时还能够大幅度提升检测目标文件的效率。
技术关键词
视频语义检索
文本
视频帧
离散特征
计算机程序产品
图片
处理器
音频解码
音频编码
分类方式
计算机设备
正确率
存储模块
可读存储介质
存储器
系统为您推荐了相关专利信息
物品推荐方法
样本
训练推荐模型
大语言模型
物品推荐装置
轨迹预测模型
障碍物
图片
电子设备
计算机程序产品