一种基于交叉注意力重分配的多实例可控图像生成方法

正文

推荐专利

申请号：CN202410772782

申请日期：2024-06-17

公开号：CN118628611B

公开日期：2025-09-19

类型：发明专利

摘要

本发明公开了一种基于交叉注意力重分配的多实例可控图像生成方法，首先构建ChatGPT代码提示链CoC。然后在ChatGPT中使用代码提示链，生成符合多实例文本提示生成任务中所需要的布局。然后在扩散模型每一个时间步中获得交叉注意力图，并基于布局信息，获得两个引导损失。最后使用损失引导修改当前时间步上的预测噪声，迭代优化的噪声图像最终通过解码器得到生成的多实例可控图像。本发明缓解实体缺失、属性互换、属性泄露、空间布局错误等问题的出现，在图像编辑、个性化生成和虚拟试衣等领域中实现更准确、高质量的图像生成和修改，为用户提供更符合个性化需求的服务。

技术关键词

图像生成方法注意力布局优化噪声文本编码器令牌补丁对象噪声图像解码器多实例定义虚拟试衣噪声样本大语言模型嵌入特征

系统为您推荐了相关专利信息

一种家畜体尺测量方法、系统、计算机设备及存储介质

家畜多分辨率特征点云局部测量方法特征信息处理

一种基于分组的设备间屏柜自动布置方法

屏柜自动布置方法房间列表数学模型

一种人工智能语音识别系统

语音特征编码器文本强化学习框架多头注意力机制

面向稀疏观测的爆炸超压场物理增强重构方法及系统

重构模型特征辨识模块混合特征提取积层多场景

图像生成方法、装置、智能体、智能体系统及存储介质

生成方式图像主体文本意图图像生成方法

一种基于交叉注意力重分配的多实例可控图像生成方法

站点导航

APP 下载