一种基于改进VAE的视频和图片生成方法及系统

AITNT
正文
推荐专利
一种基于改进VAE的视频和图片生成方法及系统
申请号:CN202510273785
申请日期:2025-03-10
公开号:CN120147667A
公开日期:2025-06-13
类型:发明专利
摘要
本发明涉及视频和图片生成技术领域,且公开了一种基于改进VAE的视频和图片生成方法及系统,其中的一种基于改进VAE的视频和图片生成方法包括如下步骤:S1、感知损失:用预训练的深度卷积神经网络提取图像的高级特征,并通过比较这些特征计算感知损失;S2、GAN判别器:引入一个小网络作为判别器,用于判断生成的图片是真是假;S3、时间序列相似度损失:额外引入时序模块来保证生成视频与原始视频在时序上的一致性。本发明设计合理,通过引入感知损失、GAN判别器和时间序列相似度损失,有效提升了生成图像和视频的质量。通过感知损失,能够确保生成图像在高级特征上的一致性;通过GAN判别器,能够优化VAE的生成效果,使生成图像更加真实。
技术关键词
图片生成方法 深度卷积神经网络 视频 编码器模块 生成高质量图像 图片生成技术 多层卷积神经网络 图片生成系统 解码器 局部时空特征 感知损失函数 时序依赖关系 原始图像数据 加载单元 输入模块
系统为您推荐了相关专利信息
1
潜在与像素域双阶段的视频超分模型训练方法
视频 超分辨率 模型训练方法 像素 高分辨率图片
2
一种面向多模态视频的全流程动作识别方法
动作识别模型 动作识别方法 视频帧 阶段 面向多模态数据
3
一种高炉风口异常情况检测方法、系统和存储介质
高炉风口 图像 视频拍摄装置 数据处理模块 深度学习模型
4
一种基于深度学习的轿厢内电动自行车实时检测方法、装置及计算机存储介质
检测网络模型 实时检测方法 自行车 注意力机制 电梯门机控制
5
基于多源数据融合的车场异常事件检测系统
异常事件 视频 轻量级神经网络 车型 时序
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号