视频生成模型训练方法、视频生成方法、装置及电子设备

正文

推荐专利

申请号：CN202411116935

申请日期：2024-08-14

公开号：CN119135986A

公开日期：2024-12-13

类型：发明专利

摘要

本公开提出一种视频生成模型的训练方法、视频生成方法、装置及电子设备，其中，该训练方法包括：对参考图像进行特征提取，得到第一多模态特征信息；对驱动视频进行特征提取，得到第二多模态特征信息；根据第一多模态特征信息和第二多模态特征信息生成控制条件特征信息；根据参考图像和驱动视频生成原始噪声，并对参考图像进行编码处理，得到参考图像的嵌入向量；根据控制条件特征信息、原始噪声和参考图像的嵌入向量进行噪声预测，得到符合控制条件特征信息的预测噪声；根据原始噪声和预测噪声的差异，对视频生成模型的参数进行调整，得到训练后的视频生成模型。由此，通过利用多模态条件控制信息，更能确保生成动作的稳定性。

技术关键词

视频生成模型多模态特征深度特征信息噪声预测融合特征编码特征骨骼特征编码器注意力图像视频生成方法动作特征适配器生成特征运动控制模块特征提取器

系统为您推荐了相关专利信息

一种基于事件引导的生成式视频扩散模型的视频插帧方法

视频插帧方法多模态特征融合残差学习嵌入特征事件流数据

一种基于驾驶员视觉特征融合的危险行为预警方法

融合特征视觉特征预警方法多模态数据

一种基于卷积神经网络的高频磁环电感动态阻抗校准方法

阻抗校准方法高频磁环动态融合特征双向注意力机制

融合多尺度特征增强的YOLOv11爆破现场火工品实时检测方法

融合多尺度特征实时检测方法网络模块实时图像

一种基于证据回归的多智能体协同感知系统及方法

协同感知方法协同感知系统点云特征卷积神经网络提取融合特征

视频生成模型训练方法、视频生成方法、装置及电子设备

站点导航

APP 下载