摘要
本申请涉及一种图像生成模型的训练方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取参考图像样本、目标图像样本和目标图像样本的文本描述样本;将参考图像样本、目标图像样本、目标图像样本的对象姿态信息和文本描述样本输入待训练的图像生成模型,通过图像生成模型对目标图像样本进行加噪处理,生成加噪后图像,并提取出参考图像样本的对象区域特征、目标图像样本的对象姿态特征和文本描述样本的文本特征;基于对象区域特征、对象姿态特征和文本特征,引导图像生成模型对加噪后图像进行噪声预测,得到降噪后图像;根据加噪后图像和降噪后图像,对图像生成模型进行训练。采用本方法能够提高图像生成模型生成图像的精准度。
技术关键词
图像生成模型
样本
姿态特征
对象
噪声预测
图像生成方法
计算机设备
计算机程序产品
编码特征
图像生成装置
文本编码器
图像编码器
处理器
注意力
模块
训练装置
系统为您推荐了相关专利信息
开关柜局部放电检测
相位分辨局部放电
识别算法
更新模型参数
电信号
环境感知信息
感知控制方法
综合配电箱
配电箱监测
配电网络
车辆智能座舱
交互方法
智能驾驶控制器
人工智能模型
意图