视频生成方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202411858695

申请日期：2024-12-17

公开号：CN119835497A

公开日期：2025-04-15

类型：发明专利

摘要

本申请涉及深度学习，计算机视觉，生成式人工智能技术领域，揭示了一种视频生成方法、装置、计算机设备及存储介质，所述方法包括：获取各个视频帧所对应的关键点位置数据以及参考图片，其中，所述参考图片是基于目标视频提取的，所述视频帧所对应的关键点位置数据是基于目标视频进行关键点生成得到的，而后基于所述关键点位置数据、所述参考图片以及视频生成模型进行视频生成，其中，所述视频生成模型包括多层MLPs模型、Pose Transformer模型、SVD模型，所述SVD模型嵌入有Gated Cross‑Attention模型，SVD模型是视频生成大模型。本发明通过嵌入有Gated Cross‑Attention模型的SVD模型根据输入姿态生成精确的动作视频，实现了细腻的姿态表达效果，保证输出的视频内容与输入条件的高度一致性。

技术关键词

视频生成模型视频生成方法关键点视频生成装置图片计算机设备数据端口可读存储介质人工智能技术处理器编码特征计算机视觉存储器模块

视频生成方法、装置、计算机设备及存储介质

站点导航

APP 下载