基于潜在空间导航学习的图像视频生成方法、装置、设备、介质及程序产品

正文

推荐专利

申请号：CN202510693902

申请日期：2025-05-27

公开号：CN120807722A

公开日期：2025-10-17

类型：发明专利

摘要

本发明提供一种基于潜在空间导航学习的图像视频生成方法、装置、设备、介质及程序产品，涉及人工智能技术领域。该方法包括：获取初始图像和驱动视频；其中，所述初始图像表征为包含第一人脸的静态图像，所述驱动视频表征为包含第二人脸的动态视频，所述第二人脸具有多个人脸动作信息；将所述初始图像和所述驱动视频输入训练好的图像视频生成模型，输出目标图像视频。本发明提供的实施例用以解决现有技术中存在的成本高、泛化能力弱、自由度受限的缺陷，实现无需标注人脸图像关键点，利用训练好的图像视频生成模型直接学习驱动视频的运动模式，以生成目标图像视频，模型的泛化能力高，可灵活捕捉非线性运动，突破传统的自由度限制。

技术关键词

视频生成方法视频生成模型图像样本人脸动作多尺度运动非暂态计算机可读存储介质金字塔视频生成装置解码处理器字典上采样网络人工智能技术动态计算机程序产品

基于潜在空间导航学习的图像视频生成方法、装置、设备、介质及程序产品

站点导航

APP 下载