基于文本描述的视频拼接方法、装置、存储介质及设备

正文

推荐专利

申请号：CN202510195674

申请日期：2025-02-21

公开号：CN120091175A

公开日期：2025-06-03

类型：发明专利

摘要

本申请公开了一种基于文本描述的视频拼接方法、装置、存储介质及设备，属于图像处理技术领域。根据文本描述在视频库中查找相匹配的多个视频片段；将多个视频片段调整至相同的分辨率和宽高比；利用微调后的视频帧插值模型在每个视频片段中的原有视频帧之间插入插值视频帧，以使多个视频片段的帧率相同，微调后的视频帧插值模型是利用公开数据集和视频库中的数据集联合对原有的视频帧插值模型进行微调后得到的；对多个视频片段进行拼接，得到拼接视频。本申请能生成符合用户需求的定制化拼接视频；通过将视频片段的分辨率、宽高比和帧率调整到一致，能保证拼接视频在视觉上和播放流畅性上保持一致；通过联合微调防止模型产生灾难性遗忘的问题。

技术关键词

视频拼接方法视频帧插值模型分辨率视频拼接装置插值法文本编码器标签数据上采样计算机设备图像处理技术拼接模块可读存储介质指令

系统为您推荐了相关专利信息

一种基于频率引导的分层差异感知的交互式人脸伪造检测算法

语义人脸分层注意力频率

一种基于模型量化的工业缺陷检测方法及系统

工业缺陷检测工业内窥镜设备推理方法图像模型加速方法

一种基于机器视觉智慧厂区用视频优化采集方法

像素点优化采集方法混合高斯模型序列高斯背景建模

视频处理方法、装置、电子设备及存储介质

虚拟对象生成指令图像展示动作页面

基于商显主板语义识别显示字幕的方法与商显主板

子模块显示字幕文本主板语义

基于文本描述的视频拼接方法、装置、存储介质及设备

站点导航

APP 下载