摘要
本申请提供了一种基于文本剪辑视频的方法,包括:获取待处理视频及对应的解说文本,依据预设帧数间隔从所述待处理视频抽取图像帧,并确定所述图像帧对应的图像特征向量;其中,抽取的所述图像帧数量至少1帧;依据自然段落顺序从所述解说文本中选取一个未处理的目标解说词,并确定所述目标解说词对应的文本特征向量;依据所述文本特征向量和所述图像特征向量确定与所述目标解说词向量相似度最高的目标图像帧;基于所述目标图像帧对应的时序位置对所述待处理视频进行视频截取,生成目标剪辑视频。通过特征匹配实现解说词与图像画面精准关联,避免人工逐帧处理;基于目标图像帧进行视频截取,确保叙事完整性与跨片段连贯性。
技术关键词
文本特征向量
图像特征向量
视频
时序
构建图像数据库
图像特征提取
标识
特征提取模块
匹配模块
跨模态
序列
语义
画面
标记
系统为您推荐了相关专利信息
自动拉链
控制系统
激光切割机构
抓取上料机构
实时数据采集
高空作业安全带
语义分割模型
图片
sigmoid函数
标注工具
编解码视频
深度学习模型
视频编解码方法
视频内容特征
循环神经网络模型