摘要
本申请公开了一种多视频对象合成方法,涉及图像生成技术领域,利用图像分割算法和视频对象跟踪算法对原始对象视频进行跟踪并提取出原始对象视频中存在的目标对象视频,其次利用DDIM反演法对目标对象视频和所需背景视频进行反演得到反演结果,将目标对象视频和所需背景视频导入至可视化编辑界面进行编辑导出布局视频,最后利用反演结果进行视频重建,启动视频生成模型对布局视频进行处理得到包含对象和背景的视频。通过对象视频和背景视频来引导视频生成,生成保留原始视频对象的外观和运动特征且具有物理交互效果的高质量合成视频,具有较强的可控性。
技术关键词
噪声预测
图像分割算法
文本
对象跟踪
图像特征提取
编辑界面
图像去噪模型
采样器
布局
图片
视频生成模型
图像生成技术
图像解码器
图像编码器
视频解码器
系统为您推荐了相关专利信息
加权多路径
数据融合方法
原型
跨模态
视频特征向量
大语言模型
文档自动生成方法
文本
关键词
文档自动生成系统
国际运价数据
智能解析方法
搜索工具
解析器
语义