一种基于交叉注意力机制布局条件生成图像的方法

AITNT
正文
推荐专利
一种基于交叉注意力机制布局条件生成图像的方法
申请号:CN202410871990
申请日期:2024-07-01
公开号:CN118674808A
公开日期:2024-09-20
类型:发明专利
摘要
本发明属于图像生成技术领域,公开了一种基于交叉注意力机制布局条件生成图像的方法,在总体损失中加入了质心损失,引入质心控制,对图像中的对象的位置控制的更精准;在总体损失中加入了残差注意力损失,很好地保持了语义连贯性和逻辑一致性。在去噪网络迭代过程中,基于向量更新公式调整潜在向量,无需额外的微调和配对的布局‑图像数据,保证了模型原有的生成能力,且成本更低。本发明方法具有即插即用的效果,生成符合布局的图像的速度不会减慢太多,可以方便地集成到当前现有的解决方案中。
技术关键词
残差模块 交叉注意力机制 布局 上采样 文本 对象 矩阵 中间层 图像生成技术 端点 网络 噪声 像素 语义 逻辑 编码 参数
系统为您推荐了相关专利信息
1
一种结合大语言模型辅助AIGC创作的方法
大语言模型 强化学习方法 数据 文本 图像生成模型
2
一种结构强度试验中疲劳裂纹自动分割与量化方法及装置
信息编码器 多尺度特征融合 解码器 注意力机制 疲劳裂纹长度
3
基于SurrealDB的跨模态数据搜索方法和装置
数据搜索方法 文本 图片 音频 融合算法
4
基于ECA-AC-ResUnet网络的裂缝图像分割方法
裂缝图像分割方法 上采样 解码器 全局平均池化 输出特征
5
壁纸生成方法和电子设备
文本 壁纸生成方法 编辑界面 控件 显示壁纸
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号