摘要
本申请涉及图像处理技术领域,公开了一种文本生成图像方法、装置、设备及介质,其中,方法包括:响应于获取到的包含目标对象的文本提示词,生成文本提示词对应的初始图像;其中,文本提示词包括目标对象的目标数量,初始图像包括目标对象的生成数量;在目标数量与生成数量不相等的情况下,对初始图像生成过程中的候选边界框的位置进行优化,生成优化后的边界框;基于优化后的边界框对初始图像生成过程中的当前潜在表示进行优化,得到目标潜在表示;基于目标潜在表示更新初始图像,生成目标图像,以使目标图像中目标对象的生成数量与目标数量相等。本申请提供的技术方案,能够精确控制生成图像中目标数量。
技术关键词
文本生成图像方法
注意力
对象
图像生成单元
可读存储介质
图像处理技术
存储器
处理器
指令
掩膜
计算机设备
像素点
因子
坐标
系统为您推荐了相关专利信息
特高频传感器
数字变频技术
局部放电特征
去噪方法
频带划分方法
系统性能分析
分布式策略
代价评估方法
分布式系统
可视化图表