一种基于隐空间融合的全状态图像生成系统及方法

正文

推荐专利

申请号：CN202510937821

申请日期：2025-07-08

公开号：CN120876640A

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开一种基于隐空间融合的全状态图像生成系统及方法，其基于隐空间融合的全状态图像生成模型，用于对现有图像数据进行增强。该技术结合了图像融合策略与视觉大语言模型。首先通过CLIP编码器对输入词向量和初末状态图像进行编码，映射到特征隐空间；随后通过融合模块对隐空间变量进行融合，得到中间态特征；最后通过CLIP图像解码器将融合特征解码为中间态图像，以实现数据的增强。该方法能够基于两幅初末状态的图像生成任意数量的中间态图像，在小样本训练、数据增强等领域具有很好的应用前景。

技术关键词

图像生成系统图像解码器文本编码器图像生成方法非暂态计算机可读存储介质状态图像数据编码器架构变量图像融合策略线性单元模块图像生成模型序列图像编码器大语言模型词语

一种基于隐空间融合的全状态图像生成系统及方法

站点导航

APP 下载