摘要
本公开提供了一种图像生成模型的训练方法、相关装置和介质。方法包括:获取多个图文样本对,图文样本对包括背景模板图像、噪声基准图像、噪声基准图像的图像描述信息和样本对象的样本对象图像;基于噪声基准图像、背景模板图像和模板掩码图像,确定样本拼接图像特征;基于背景模板图像中参考对象的轮廓特征、图像描述信息和样本对象图像确定去噪网络控制信息;基于样本拼接图像特征和去噪网络控制信息,通过图像生成模型进行噪声预测,得到噪声基准图像的噪声预测结果;基于多个图文样本对的噪声基准图像与噪声预测结果的比对,训练图像生成模型。本公开能提高生成目标图像的准确性。
技术关键词
图像生成模型
噪声基准
噪声预测
网络控制
样本
轮廓特征
图像生成方法
模板
注意力
图像编码
图文
嵌入特征
上采样
对象轮廓
图像生成装置
解码网络
噪声图像
系统为您推荐了相关专利信息
铁路转向架
摇枕结构
结构优化方法
训练深度学习模型
图谱
能耗预测方法
能耗预测模型
车辆识别码
路况信息
路段
档位
视频流
多元线性回归模型
视频播放流畅度
数据
工况特征
工况参数
状态分析方法
数据
强化学习模型