摘要
本申请公开了一种基于文本描述的视频拼接方法、装置、存储介质及设备,属于图像处理技术领域。根据文本描述在视频库中查找相匹配的多个视频片段;将多个视频片段调整至相同的分辨率和宽高比;利用微调后的视频帧插值模型在每个视频片段中的原有视频帧之间插入插值视频帧,以使多个视频片段的帧率相同,微调后的视频帧插值模型是利用公开数据集和视频库中的数据集联合对原有的视频帧插值模型进行微调后得到的;对多个视频片段进行拼接,得到拼接视频。本申请能生成符合用户需求的定制化拼接视频;通过将视频片段的分辨率、宽高比和帧率调整到一致,能保证拼接视频在视觉上和播放流畅性上保持一致;通过联合微调防止模型产生灾难性遗忘的问题。
技术关键词
视频拼接方法
视频帧
插值模型
分辨率
视频拼接装置
插值法
文本编码器
标签
数据
上采样
计算机设备
图像处理技术
拼接模块
可读存储介质
指令
系统为您推荐了相关专利信息
工业缺陷检测
工业内窥镜设备
推理方法
图像
模型加速方法
像素点
优化采集方法
混合高斯模型
序列
高斯背景建模