摘要
本发明公开一种基于隐空间融合的全状态图像生成系统及方法,其基于隐空间融合的全状态图像生成模型,用于对现有图像数据进行增强。该技术结合了图像融合策略与视觉大语言模型。首先通过CLIP编码器对输入词向量和初末状态图像进行编码,映射到特征隐空间;随后通过融合模块对隐空间变量进行融合,得到中间态特征;最后通过CLIP图像解码器将融合特征解码为中间态图像,以实现数据的增强。该方法能够基于两幅初末状态的图像生成任意数量的中间态图像,在小样本训练、数据增强等领域具有很好的应用前景。
技术关键词
图像生成系统
图像解码器
文本编码器
图像生成方法
非暂态计算机可读存储介质
状态图像数据
编码器架构
变量
图像融合策略
线性单元
模块
图像生成模型
序列
图像编码器
大语言模型
词语