摘要
本发明涉及视频混剪技术领域,尤其为一种基于生成式模型的自动混剪视频的方法,其方法包括如下步骤:建立视频库,首先收集大量的原始视频,对原始视频解码后,计算图片相似度,使用图片特征作为视频代表特征,训练模型,包括开端模型和续写模型,使用序列‑序列的分段方式训练模型。本发明使用了序列‑序列的生成式模型来完成视频自动混剪,在应用此模型时,根据视频混剪自身的特点,将输入输出变为特征组成的序列,即模型的输入输出是N维的文本特征序列和对应的N维视频特征序列,经过训练后,此模型可以获取文本与视频、视频片段与视频片段之间的内在联系,从而可以准确的理解语义。
技术关键词
文本
序列
视频解码
视频库
计算误差
图片
图像
多模态
数据
分段
语句
语义
代表
短视频
舞台
语音
样本
系统为您推荐了相关专利信息
数据编码器
运算装置
脸部特征
储存装置
图像编码器
大数据
生成平台
身体状况数据
生成方法
层次分析法