摘要
本发明适用自然语言处理与计算机视觉交叉的跨模态技术领域,提供了一种面向抽象文本的生成式视频检索方法,该方法包括:获取用于视频生成的抽象文本,根据该抽象文本,生成若干个第一视频,从预设的视频素材库中搜索分别与各第一视频相匹配的第二视频,将每个第二视频与抽象文本进行匹配,根据匹配结果确定由抽象文本生成得到的目标视频,从而提高了基于抽象文本生成的视频的画面质量,并提高了视频内容的丰富性和生动性。
技术关键词
文本
视频检索方法
计算机视觉交叉
视频搜索
视频检索装置
模态技术
编码
可读存储介质
处理器
自然语言
语义
图像
存储器
系统为您推荐了相关专利信息
服装管理方法
语义图谱
数据中心
图形处理器
实体
图像特征向量
答案生成方法
大语言模型
多模态
分层