视频生成和视频生成模型的训练方法、装置、设备和介质

正文

推荐专利

申请号：CN202411598040

申请日期：2024-11-08

公开号：CN119399839B

公开日期：2025-10-28

类型：发明专利

摘要

本公开提供了一种视频生成和视频生成模型的训练方法、装置、设备和介质，涉及计算机视觉、深度学习、大模型等技术领域，可应用于AIGC、数字人、智能电商等场景。具体实现方案为：获取动作姿态序列和展示有目标对象的参考图像；其中，动作姿态序列中的元素表征根据人体关键点生成的动作姿态；对参考图像进行编码，得到目标对象的外观特征；从动作姿态序列中提取姿态指导特征，并根据姿态指导特征、噪声特征和外观特征，生成目标特征；对目标特征进行解码，得到展示有目标对象的动作驱动视频。

技术关键词

视频生成模型噪声特征输出特征视频生成方法调制特征注意力机制序列人体关键点对象编码元素图像视频生成装置解码模块处理器

视频生成和视频生成模型的训练方法、装置、设备和介质

站点导航

APP 下载