一种结合生成大模型的视频修复数据集构建及修复方法

AITNT
正文
推荐专利
一种结合生成大模型的视频修复数据集构建及修复方法
申请号:CN202510601443
申请日期:2025-05-12
公开号:CN120634908A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了一种结合生成大模型的视频修复数据集构建及修复方法,属于视频修复技术领域,其包括以下步骤:S1、切片;S2、筛选:对切片进行美学评分和运动检测,筛选保留高动态、高画质片段;S3、核心物体分割;S4、提取文本特征;S5、模型输入;S6、特征融合;S7、模型训练:仅训练交叉注意力层参数,锁定其他层梯度以降低计算成本;S8、损失函数计算;S9、视频输入:输入待修复视频,生成其物体Mask及文本描述;S10、修复视频输出:将Mask视频、物体Mask及文本描述输入改进后的生成大模型,输出修复后视频。本发明的分阶段特征注入策略,兼顾全局自然性与局部真实感,显著提升修复内容与原始视频的视觉一致性。
技术关键词
修复方法 物体 交叉注意力机制 随机噪声 视频修复技术 切片 运动检测 优化器 文本生成模型 美学 高维特征向量 双线性插值法 输出特征 深度学习框架 数据 文本编码器 参数
系统为您推荐了相关专利信息
1
一种基于图向量数据库的精确物体抓取和操控方法
锚点 物体 图像 融合特征 操控方法
2
一种基于生成模型的跨模态图文行人检索方法
图像特征向量 图像编码器 文本特征向量 文本编码器 行人检索方法
3
一种告警根因分析方法、装置、设备及介质
故障场景 历史告警数据 训练样本数据 分层 标签
4
一种3D点云生成、识别与分割方法
激光器 分割方法 3D点云 照片 控制器控制电机
5
三维重建方法、装置及电子设备
点云模型 多视角 图像匹配 邻域 三维重建方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号