一种结合生成大模型的视频修复数据集构建及修复方法

正文

推荐专利

申请号：CN202510601443

申请日期：2025-05-12

公开号：CN120634908A

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了一种结合生成大模型的视频修复数据集构建及修复方法，属于视频修复技术领域，其包括以下步骤：S1、切片；S2、筛选：对切片进行美学评分和运动检测，筛选保留高动态、高画质片段；S3、核心物体分割；S4、提取文本特征；S5、模型输入；S6、特征融合；S7、模型训练：仅训练交叉注意力层参数，锁定其他层梯度以降低计算成本；S8、损失函数计算；S9、视频输入：输入待修复视频，生成其物体Mask及文本描述；S10、修复视频输出：将Mask视频、物体Mask及文本描述输入改进后的生成大模型，输出修复后视频。本发明的分阶段特征注入策略，兼顾全局自然性与局部真实感，显著提升修复内容与原始视频的视觉一致性。

技术关键词

修复方法物体交叉注意力机制随机噪声视频修复技术切片运动检测优化器文本生成模型美学高维特征向量双线性插值法输出特征深度学习框架数据文本编码器参数

系统为您推荐了相关专利信息

一种基于图向量数据库的精确物体抓取和操控方法

锚点物体图像融合特征操控方法

一种基于生成模型的跨模态图文行人检索方法

图像特征向量图像编码器文本特征向量文本编码器行人检索方法

一种告警根因分析方法、装置、设备及介质

故障场景历史告警数据训练样本数据分层标签

一种3D点云生成、识别与分割方法

激光器分割方法 3D点云照片控制器控制电机

三维重建方法、装置及电子设备

点云模型多视角图像匹配邻域三维重建方法

一种结合生成大模型的视频修复数据集构建及修复方法

站点导航

APP 下载