摘要
本发明公开了基于多条件控制的去噪视频生成方法,涉及计算机视觉和图像处理技术领域,包括:指定运动轨迹,将其转换成目标对象的运动标记,设置文本和情感标签,基于文本和情感标签获取条件信息表示,指定镜头控制选项作为相机运动标记,获取第一高斯噪声,基于第一高斯噪声获取高斯噪声的潜空间表示,将目标对象的运动标记、时间步、条件信息表示、高斯噪声的潜空间表示输入到视频生成模型,输出预测噪声,基于预测噪声获取视频的潜空间表示,将视频的潜空间表示经过解码器处理得到指定视频,实现了多条件控制生成视频,使得视频生成质量提升。
技术关键词
视频生成方法
视频生成模型
噪声
标记
运动特征
相机
文本
对象
数据
阶段
模块
解码器
标签
预训练模型
图像处理技术
计算机视觉
编码器
镜头
系统为您推荐了相关专利信息
动态监测方法
数据立方体
生理
动态知识图谱
气象
集成经验模态分解
特征工程
分解算法
滑动窗口方法
噪声
破坏性检测方法
轮廓
图像
频域光学相干断层成像
OCT设备