摘要
本申请提供一种图像生成方法、装置、电子设备及存储介质,涉及图像生成技术领域。该方法包括:获取输入的文本描述内容以及预先训练的图像生成模型,其中,文本描述内容包括:多个主体的类型描述信息;获取多个主体的区域掩码,区域掩码用于指示待生成图像中多个主体所在的图像区域;获取多个图像区域中目标图像区域的区域控制参数,区域控制参数用于控制目标图像区域内对应主体的全局显示信息;根据多个主体的类型描述信息和区域控制参数,采用图像生成模型生成包含多个主体的目标图像。本申请可以实现多主体同框的图像生成。
技术关键词
图像生成模型
图像生成方法
显示信息
风格
文本
参数
图像生成技术
电子设备
图像生成装置
融合特征
处理器
平滑度
时序
可读存储介质
模块
因子
程序
指令
计算机
系统为您推荐了相关专利信息
物体检测技术
信息匹配方法
声纹识别技术
多模态
画像
语音识别模型
语音识别方法
语音编码器
样本
单人