摘要
本发明公开了一种基于分步式自我反馈的特殊文本生成图片方法,基于用户文本内容,确定场景中各个对象的空间布局情况;每轮生成一组边界框时对当前结果进行反馈输出,生成最终的整体布局图;参照所得到的包含各个对象必要信息的最终整体布局图,为每个对象生成对应的掩码潜变量;生成对应每个对象的潜在图像,再将所有潜在图像与背景图像结合生成中间图像;逐个评估中间图像中的每个对象边界框的内容,结合细节反馈模块的输出,对不满足条件的边界框中的内容进行多轮迭代细化,并融合至原图像中,直至每一个边界框中的内容都满足条件,本方法对于提升自动化系统中图像生成任务的效果具有重要意义。
技术关键词
图片方法
对象
布局
变量
抽象思维能力
注意力
Softmax函数
标记
文本编码器
噪声
多模态
自动化系统
图像嵌入
模块
物体
视觉特征
场景
系统为您推荐了相关专利信息
涡轮分子泵
仿真算法
参数配置方法
变量
遗传算法