基于时空融合的多模态存量视频高效检索方法与装置

AITNT
正文
推荐专利
基于时空融合的多模态存量视频高效检索方法与装置
申请号:CN202411684267
申请日期:2024-11-22
公开号:CN119884412A
公开日期:2025-04-25
类型:发明专利
摘要
本发明提供一种基于时空融合的多模态存量视频高效检索方法与装置,包括:计算待检索视频的帧间相似度,并基于帧间相似度删除待检索视频的冗余帧,得到目标待检索视频;基于查询文本对目标待检索视频进行筛选处理,得到多个目标待检索视频片段;对查询文本和多个目标待检索视频片段分别进行特征提取处理,得到文本特征和多个视频特征;调用基于多模态融合的视频片段检索模型基于文本特征和多个视频特征进行模态交互预测,得到预测结果,并基于预测结果确定多个目标待检索视频片段中与查询文本对应的目标视频片段,通过删除冗余帧以及层级化目标视频片段搜索,实现从海量视频中快速筛选出目标视频片段,有效提升了视频筛选的效率。
技术关键词
视频 检索方法 文本 录像设备 多模态 融合特征 非暂态计算机可读存储介质 关键帧 冗余 软件开发工具包 处理器 特征提取模块 检索装置 关键词 计算机程序产品 匹配模块 存储器 电子设备 图像
系统为您推荐了相关专利信息
1
一种基于超声内镜的炎症性肠病分析方法及系统
炎症性肠病患者 超声内镜 分析方法 多模态数据融合 特征值
2
图像生成方法及装置、图像生成模型训练方法及装置
图像生成模型 大语言模型 图像生成方法 语义向量 文本编码器
3
一种自然语言转SQL语句的方法
语句 自然语言 BERT模型 大语言模型 行业知识图谱
4
将影像动画解算至无人机群舞步航路方法、设备及介质
动画 视频 影像 无人机集群控制 线性
5
基于数据合成和颜色空间学习的行人重识别方法
重识别方法 颜色 身份 行人重识别模型 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号