视频生成方法、视频生成模型的训练方法和相关装置

正文

推荐专利

申请号：CN202510345066

申请日期：2025-03-21

公开号：CN120236230A

公开日期：2025-07-01

类型：发明专利

摘要

本申请实施例公开了一种视频生成方法、视频生成模型的训练方法和相关装置。主要技术方案包括：获取人脸图像和视频描述文本；所述人脸图像包括目标人脸；从所述人脸图像中提取所述目标人脸的二维特征和三维特征；将所述目标人脸的二维特征和三维特征进行融合，得到所述目标人脸的身份特征表示；基于所述身份特征表示和所述视频描述文本，预测得到包含所述目标人脸的目标视频。本申请能够有效捕捉目标人脸的多维度特征，从而生成更加真实和自然的目标视频。

技术关键词

视频生成模型人脸身份视频生成方法文本噪声图像变换器模块损失函数取值顶点网络生成调制信号视频生成装置坐标多头注意力机制融合特征样本特征提取单元计算机程序产品

系统为您推荐了相关专利信息

航行通告报文的分类方法、装置及电子设备

报文训练特征数据深度神经网络协方差矩阵

一种文本信息补全方法和系统

语义标签信息补全方法文本预训练语言模型语义角色标注

一种基于区块链的号码认证方法及系统

号码认证方法高风险私钥标识零知识证明协议

一种对代码模型进行微调的方法及装置

补丁抽象语法树代码库转换文本节点

一种基于树编码的长视频生成的优化方法

关键帧大语言模型视频生成模型节点视频帧

视频生成方法、视频生成模型的训练方法和相关装置

站点导航

APP 下载