摘要
本申请涉及人工智能技术领域,提供了一种目标视频生成方法、装置、电子设备及可读存储介质,该方法包括:对第一参考图像和第二参考图像分别进行潜空间特征提取,并进行加权融合处理,得到对应的参考图像的多个第一融合特征图;对第一参考图像和第二参考图像分别进行视觉特征提取并进行加权拼接处理,得到对应的参考图像的多个第二融合特征图;基于各个第一融合特征图、各个第二融合特征图、第一参考图像的视觉特征图和第二参考图像的视觉特征图进行扩散处理,生成目标视频的多个视频帧的特征图;根据目标视频的多个视频帧的特征图,生成目标视频,解决现有技术中视频生成最后一帧图像不可控的问题,提高目标视频的准确性和流畅性。
技术关键词
融合特征
图像
注意力
视频生成模型
视觉特征提取
视频生成方法
空间特征提取
视频生成装置
文本
非线性
电子设备
可读存储介质
人工智能技术
处理器
模块
存储器
编码
系统为您推荐了相关专利信息
医学图像分割系统
医学图像分割方法
医学图像分割模型
编码器信息
全局信息融合
颜色
生成重构图像
控制点
神经网络模型构建
图像编码器
混合编码方法
熵编码数据
生成神经网络
知识蒸馏方法
概率建模方法
针灸机器人
多模态数据采集
压电式触觉传感器
注意力机制
经络穴位模型