一种基于交叉注意力机制布局条件生成图像的方法

正文

推荐专利

申请号：CN202410871990

申请日期：2024-07-01

公开号：CN118674808A

公开日期：2024-09-20

类型：发明专利

摘要

本发明属于图像生成技术领域，公开了一种基于交叉注意力机制布局条件生成图像的方法，在总体损失中加入了质心损失，引入质心控制，对图像中的对象的位置控制的更精准；在总体损失中加入了残差注意力损失，很好地保持了语义连贯性和逻辑一致性。在去噪网络迭代过程中，基于向量更新公式调整潜在向量，无需额外的微调和配对的布局‑图像数据，保证了模型原有的生成能力，且成本更低。本发明方法具有即插即用的效果，生成符合布局的图像的速度不会减慢太多，可以方便地集成到当前现有的解决方案中。

技术关键词

残差模块交叉注意力机制布局上采样文本对象矩阵中间层图像生成技术端点网络噪声像素语义逻辑编码参数

系统为您推荐了相关专利信息

一种结合大语言模型辅助AIGC创作的方法

大语言模型强化学习方法数据文本图像生成模型

一种结构强度试验中疲劳裂纹自动分割与量化方法及装置

信息编码器多尺度特征融合解码器注意力机制疲劳裂纹长度

基于SurrealDB的跨模态数据搜索方法和装置

数据搜索方法文本图片音频融合算法

基于ECA-AC-ResUnet网络的裂缝图像分割方法

裂缝图像分割方法上采样解码器全局平均池化输出特征

壁纸生成方法和电子设备

文本壁纸生成方法编辑界面控件显示壁纸

一种基于交叉注意力机制布局条件生成图像的方法

站点导航

APP 下载