摘要
本申请提供一种可交互的视频生成方法,涉及深度学习技术领域,方法包括获取训练数据,训练数据包括视频数据和对应视频数据的交互信息;视频数据由若干帧低分辨率图像组成;从训练数据中获取初始帧的图像隐层特征;根据图像隐层特征和对应帧的交互信息进行特征转换处理,得到第一帧图像和目标图像隐层特征;根据目标图像隐层特征进行图像重建处理,得到重建低分辨率图像;根据重建低分辨率图像进行图像超分辨率处理,得到预生成图像帧,直至得到对应训练数据中每一帧数的预生成图像帧,得到视频生成模型;采用视频生成模型处理输入数据,已得到目标视频。本申请通过上述方法解决了现有视频生成技术无法进行实时交互调整的问题。
技术关键词
视频生成方法
图像重建
视频生成模型
生成图像帧
图像超分辨率
转换编码器
信息编码器
解码器
数据
视频生成技术
超分辨率模型
深度学习技术
转换器