摘要
本发明涉及视频和图片生成技术领域,且公开了一种基于改进VAE的视频和图片生成方法及系统,其中的一种基于改进VAE的视频和图片生成方法包括如下步骤:S1、感知损失:用预训练的深度卷积神经网络提取图像的高级特征,并通过比较这些特征计算感知损失;S2、GAN判别器:引入一个小网络作为判别器,用于判断生成的图片是真是假;S3、时间序列相似度损失:额外引入时序模块来保证生成视频与原始视频在时序上的一致性。本发明设计合理,通过引入感知损失、GAN判别器和时间序列相似度损失,有效提升了生成图像和视频的质量。通过感知损失,能够确保生成图像在高级特征上的一致性;通过GAN判别器,能够优化VAE的生成效果,使生成图像更加真实。
技术关键词
图片生成方法
深度卷积神经网络
视频
编码器模块
生成高质量图像
图片生成技术
多层卷积神经网络
图片生成系统
解码器
局部时空特征
感知损失函数
时序依赖关系
原始图像数据
加载单元
输入模块
系统为您推荐了相关专利信息
动作识别模型
动作识别方法
视频帧
阶段
面向多模态数据
高炉风口
图像
视频拍摄装置
数据处理模块
深度学习模型
检测网络模型
实时检测方法
自行车
注意力机制
电梯门机控制