摘要
本申请提供实时可交互的视频生成方法及系统,涉及深度学习技术领域,包括获取训练数据,训练数据包括交互信息和与交互信息对应的视频数据;对训练数据进行预处理,得到目标训练数据;根据目标训练数据进行模型训练,模型训练包括模型预训练过程和视频预生成过程;模型预训练过程包括低分辨率图像重建模型的训练和图像超分辨率模型的训练;视频预生成过程包括根据可交互的视频生成模型进行视频预生成,以此完成对可交互的视频生成模型的训练,可交互的视频生成模型中具有训练完成的低分辨率图像重建模型和超分辨率模型;利用完成训练的可交互的视频生成模型进行可交互视频的生成。通过该方法解决了现有视频生成技术无法进行实时交互的问题。
技术关键词
视频生成模型
图像重建
视频生成方法
超分辨率模型
模型预训练
解码器
交互视频
模型训练模块
转换编码器
信息编码器
视频生成技术
数据获取模块
视频生成系统
转换器
生成图像帧
系统为您推荐了相关专利信息
视频生成模型
序列
双向注意力
视频生成方法
视频帧特征
人体动作数据
数据集获取方法
视频生成模型
动作捕捉设备
动画
自然语言
流水线
并行方法
并行训练方法
计算机执行指令