摘要
本申请实施例公开了一种图像生成方法、模型训练方法、装置、设备及存储介质,该图像生成方法包括:在接收到待生成图像的描述文本时,随机生成噪声图像;将所述噪声图像和所述描述文本输入图像生成模型,得到所述描述文本对应的第一预测噪声;所述图像生成模型在训练时是基于加入样本图像中的高斯噪声、预测的噪声分布以及分割掩码进行网络参数的调整的,所述分割掩码与所述样本图像所对应图像描述中的实体词和属性对应;根据所述噪声图像和所述第一预测噪声,生成所述描述文本所对应的目标图像。本申请实施例可以提高所生成的目标图像与描述文本之间的语义一致性和画面美观性,而且可以提高图像生成效率,可以节省存储成本。
技术关键词
图像生成模型
噪声图像
注意力机制
图像生成方法
文本
网络
样本
生成噪声
模型训练方法
参数
属性匹配
词语
图像生成装置
模块
误差
噪声预测
处理器
系统为您推荐了相关专利信息
电子技术课程
教学管理方法
个性化学习路径
学生
节点
自然语言
数据统计分析方法
语句
关键词
计算机可执行指令
矿车轨道
异物检测方法
文本特征向量
深度神经网络检测
模态特征
病变区域自动分割方法
编码器
解码器
多级特征
瓶颈