视频生成方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202510547993

申请日期：2025-04-28

公开号：CN120475227A

公开日期：2025-08-12

类型：发明专利

摘要

本发明实施例涉及一种视频生成方法、装置、计算机设备及存储介质，通过针对初始视频的每一帧图像进行填充处理，得到第一图像；从初始视频中获取第二图像，以及获取目标音频；从目标音频提取音频特征，从第一图像提取第一图像特征，从第二图像提取第二图像特征；对第一图像特征和第二图像特征进行对齐操作；根据音频特征和对齐后的第二图像特征对第二图像特征进行空间变形；根据变形后的第二图像特征和第一图像特征生成口型图像；根据每个口型图像与目标音频生成目标视频。由此，可以在保持人物身份特征的同时，实现口型与语音内容高度同步的目标视频生成，提升口型与语音匹配生成的自然度和视觉真实感。

技术关键词

图像视频生成方法卷积神经网络提取计算机设备视觉真实感视频生成装置音频特征提取上采样视频识别模块注意力机制处理器程序语音存储器编码器

系统为您推荐了相关专利信息

一种运动轨迹重现方法、装置、计算机设备及存储介质

重现方法对象运动轨迹计算机可执行程序

基于选择性状态空间机制的微小害虫图像检测方法

害虫图像智能检测模块空间模块状态空间模型多尺度特征

一种覆铜板浸胶过程智能视觉监控方法

智能视觉监控方法特征值胶液图像分割算法覆铜板

一种基于棋盘网格拓扑编码的材料识别方法及智能预审系统

材料识别方法棋盘指标网格高清

一种针对遥感图像的目标检测方法及系统

图像数据预处理遥感图像处理空洞全局平均池化预训练模型

视频生成方法、装置、计算机设备及存储介质

站点导航

APP 下载