摘要
本公开是关于一种数据生成方法、装置、电子设备及存储介质,属于计算机技术领域。方法包括:确定数据生成模型,数据生成模型包括文本处理网络和图像处理网络;通过文本处理网络,对第一参考文本进行特征提取,得到第一文本特征;通过图像处理网络,以第一文本特征为引导,对第一图像特征进行去噪,得到第一中间特征,对第一中间特征进行非线性变换,得到第二中间特征,以第一文本特征和第二中间特征为引导,对第一中间特征进行去噪,得到第二图像特征;通过图像处理网络,基于第二图像特征,生成目标图像,目标图像与第一参考文本的描述相符。本公开能够在数据生成场景中提高多模态特征的理解能力和生成能力,提高了生成的目标图像的准确性。
技术关键词
图像处理网络
数据生成方法
文本
数据生成模型
噪声特征
样本
权重特征
查询特征
图像处理单元
键特征
非线性
随机噪声
电子设备
数据生成装置
多模态特征
处理器
可读存储介质
解码
系统为您推荐了相关专利信息
分辨率提升
视觉问答方法
多模态
压缩器
文本编码器
大语言模型
Hadamard变换
插值模块
矩阵
量化误差
态势感知方法
决策树算法
感知知识库
构建决策树
决策树模型