基于文本描述的视频拼接方法、装置、存储介质及设备

AITNT
正文
推荐专利
基于文本描述的视频拼接方法、装置、存储介质及设备
申请号:CN202510195674
申请日期:2025-02-21
公开号:CN120091175A
公开日期:2025-06-03
类型:发明专利
摘要
本申请公开了一种基于文本描述的视频拼接方法、装置、存储介质及设备,属于图像处理技术领域。根据文本描述在视频库中查找相匹配的多个视频片段;将多个视频片段调整至相同的分辨率和宽高比;利用微调后的视频帧插值模型在每个视频片段中的原有视频帧之间插入插值视频帧,以使多个视频片段的帧率相同,微调后的视频帧插值模型是利用公开数据集和视频库中的数据集联合对原有的视频帧插值模型进行微调后得到的;对多个视频片段进行拼接,得到拼接视频。本申请能生成符合用户需求的定制化拼接视频;通过将视频片段的分辨率、宽高比和帧率调整到一致,能保证拼接视频在视觉上和播放流畅性上保持一致;通过联合微调防止模型产生灾难性遗忘的问题。
技术关键词
视频拼接方法 视频帧 插值模型 分辨率 视频拼接装置 插值法 文本编码器 标签 数据 上采样 计算机设备 图像处理技术 拼接模块 可读存储介质 指令
系统为您推荐了相关专利信息
1
一种基于频率引导的分层差异感知的交互式人脸伪造检测算法
语义 人脸 分层 注意力 频率
2
一种基于模型量化的工业缺陷检测方法及系统
工业缺陷检测 工业内窥镜设备 推理方法 图像 模型加速方法
3
一种基于机器视觉智慧厂区用视频优化采集方法
像素点 优化采集方法 混合高斯模型 序列 高斯背景建模
4
视频处理方法、装置、电子设备及存储介质
虚拟对象 生成指令 图像 展示动作 页面
5
基于商显主板语义识别显示字幕的方法与商显主板
子模块 显示字幕 文本 主板 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号