视频生成方法、视频生成模型的训练方法、装置、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202411536555

申请日期：2024-10-30

公开号：CN119364132A

公开日期：2025-01-24

类型：发明专利

摘要

本申请提供了一种视频生成方法、视频生成模型的训练方法、装置、设备、存储介质及程序产品；方法包括：从第一视频的多个视频帧中识别出检测框，其中，每个视频帧中的检测框在视频帧中包围目标对象的面部；基于多个视频帧的检测框确定包围框，其中，包围框在多个视频帧中均包围目标对象的面部；确定每个视频帧的掩码区域，其中，每个视频帧的掩码区域在视频帧中包围目标对象的嘴部；基于掩码区域对视频帧中位于包围框内的区域进行掩码处理，得到掩码视频帧；掩码视频帧构成掩码视频；基于掩码视频、第一视频和音频数据，生成第二视频，其中，在第二视频中目标对象的嘴部动作与音频数据同步匹配。通过本申请，能够提升视觉配音的配音质量。

技术关键词

视频生成模型视频帧视频生成方法数据处理模块计算机可执行指令音频特征编码特征对象空间特征提取图像编码噪声样本编码像素块面部噪声预测注意力

系统为您推荐了相关专利信息

深部岩性识别方法、装置、设备及存储介质

构建机器学习模型岩性识别方法初始聚类中心标签矩阵

一种面向监控视频的快速车辆检索方法

面向监控视频车辆检索方法关键帧去重算法视频帧

美术资源的测试方法、装置、电子设备和存储介质

美术测试设备执行测试方法视角资源

一种五恒系统对室内空气质量的控制方法及控制系统

空气质量信息分时段数据采集模块机器学习模型人机交互模块

端到端的驾驶员酒精检测方法、装置、存储介质及车辆

驾驶员酒精检测深度学习网络模型图像采集模块车载显示屏视频帧

视频生成方法、视频生成模型的训练方法、装置、设备、存储介质及程序产品

站点导航

APP 下载