一种基于改进VAE的视频和图片生成方法及系统

正文

推荐专利

申请号：CN202510273785

申请日期：2025-03-10

公开号：CN120147667A

公开日期：2025-06-13

类型：发明专利

摘要

本发明涉及视频和图片生成技术领域，且公开了一种基于改进VAE的视频和图片生成方法及系统，其中的一种基于改进VAE的视频和图片生成方法包括如下步骤：S1、感知损失：用预训练的深度卷积神经网络提取图像的高级特征，并通过比较这些特征计算感知损失；S2、GAN判别器：引入一个小网络作为判别器，用于判断生成的图片是真是假；S3、时间序列相似度损失：额外引入时序模块来保证生成视频与原始视频在时序上的一致性。本发明设计合理，通过引入感知损失、GAN判别器和时间序列相似度损失，有效提升了生成图像和视频的质量。通过感知损失，能够确保生成图像在高级特征上的一致性；通过GAN判别器，能够优化VAE的生成效果，使生成图像更加真实。

技术关键词

图片生成方法深度卷积神经网络视频编码器模块生成高质量图像图片生成技术多层卷积神经网络图片生成系统解码器局部时空特征感知损失函数时序依赖关系原始图像数据加载单元输入模块

系统为您推荐了相关专利信息

潜在与像素域双阶段的视频超分模型训练方法

视频超分辨率模型训练方法像素高分辨率图片

一种面向多模态视频的全流程动作识别方法

动作识别模型动作识别方法视频帧阶段面向多模态数据

一种高炉风口异常情况检测方法、系统和存储介质

高炉风口图像视频拍摄装置数据处理模块深度学习模型

一种基于深度学习的轿厢内电动自行车实时检测方法、装置及计算机存储介质

检测网络模型实时检测方法自行车注意力机制电梯门机控制

基于多源数据融合的车场异常事件检测系统

异常事件视频轻量级神经网络车型时序

一种基于改进VAE的视频和图片生成方法及系统

站点导航

APP 下载