摘要
本申请公开了视频生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC基于人工智能的内容生成等场景。具体方案:获取源视频、参考物体的第一参考图像及源视频中与目标接触部位交互的原始物体对应的目标掩码图像序列;根据第一参考图像和目标掩码图像序列,获取与源视频在时间和空间上对齐的参考视频;分别根据源视频和参考视频进行编码,得到源视频对应的第一潜在空间表示和参考视频对应的第二潜在空间表示;根据目标掩码图像序列,对第一潜在空间表示和第二潜在空间表示进行融合,得到第三潜在空间表示;根据第三潜在空间表示,生成目标接触部位与参考物体交互的目标视频。
技术关键词
图像
分块
关键帧
序列
视频生成方法
物体
视频生成装置
尺寸
电子设备
人工智能技术
计算机程序产品
计算机视觉
处理器通信
编码模块
指令
可读存储介质
系统为您推荐了相关专利信息
图像显示屏幕
消化内镜
操作台
数据输入键盘
边缘检测算法
巡检机器人
射频识别技术
隧道
数据采集模块
对象
发光元件
背光模组
光源模组
图像生成单元
反光元件
高光谱相机
信息提取方法
反射率
信息提取装置
三维成像
逻辑电路
内建自测试
程序执行轨迹
测试方法
芯片