基于分步式自我反馈的特殊文本生成图片方法

正文

推荐专利

申请号：CN202510440090

申请日期：2025-04-09

公开号：CN120375136A

公开日期：2025-07-25

类型：发明专利

摘要

本发明公开了一种基于分步式自我反馈的特殊文本生成图片方法，基于用户文本内容，确定场景中各个对象的空间布局情况；每轮生成一组边界框时对当前结果进行反馈输出，生成最终的整体布局图；参照所得到的包含各个对象必要信息的最终整体布局图，为每个对象生成对应的掩码潜变量；生成对应每个对象的潜在图像，再将所有潜在图像与背景图像结合生成中间图像；逐个评估中间图像中的每个对象边界框的内容，结合细节反馈模块的输出，对不满足条件的边界框中的内容进行多轮迭代细化，并融合至原图像中，直至每一个边界框中的内容都满足条件，本方法对于提升自动化系统中图像生成任务的效果具有重要意义。

技术关键词

图片方法对象布局变量抽象思维能力注意力 Softmax函数标记文本编码器噪声多模态自动化系统图像嵌入模块物体视觉特征场景

系统为您推荐了相关专利信息

一种涡轮分子泵的结构参数配置方法、装置及涡轮分子泵

涡轮分子泵仿真算法参数配置方法变量遗传算法

一种公路工程用公路隧道检测方法及系统

隧道检测方法公路三维模型应力隧道检测系统

一种表单生成方法及装置

表单生成方法边界特征布局模板尺寸特征元素

一种面向安全编码图像的逆向解析及恢复关键属性的方法

混合图像数据样本编码器分类器训练随机噪声

界面交互的方法、装置、设备和存储介质

电子设备画面三维模型处理单元界面交互方法

基于分步式自我反馈的特殊文本生成图片方法

站点导航

APP 下载