基于分化注意力和去噪过程引导的多目标图像生成方法

正文

推荐专利

申请号：CN202411591540

申请日期：2024-11-08

公开号：CN119722833B

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开了一种基于分化注意力和去噪过程引导的多目标图像生成方法，其步骤包括：1)针对给定包括N个目标词的文本提示y以及一初始隐编码zT，利用稳定扩散模型生成文本提示y中每一目标词与zT之间的交叉注意力图CAT；2)通过设定损失函数优化初始隐编码zT；3)稳定扩散模型生成文本提示y中每一目标词与优化后的初始隐编码zT之间的最优交叉注意力图4)稳定扩散模型对优化后的初始隐编码zT进行迭代去噪并对设定时间步生成的交叉注意力图进行插值；然后对迭代去噪结束所得隐编码z0进行解码生成该文本提示y对应的图像。本发明有效提高生成图像与给定文本提示之间的语义匹配性。

技术关键词

注意力图像生成方法编码损失函数优化文本存储计算机程序处理器可读存储介质解码存储器服务器语义指令参数

系统为您推荐了相关专利信息

基于图注意力的海报自适应布局方法、装置、设备及介质

节点更新布局方法元素海报非易失性计算机可读存储介质

用于预测弹簧针健康状况的方法和系统

弹簧针深度学习模型警报系统编码器显示装置

服饰类别识别模型的训练方法和服饰类别的识别方法、装置

预训练模型服饰样本图像多模态

基于大模型的位置去偏的长期对话方法

对话方法对话系统注意力处理器基座

用于三维湍流预测的物理注意力增强傅里叶神经算子

湍流注意力机制标记特征物理切片

基于分化注意力和去噪过程引导的多目标图像生成方法

站点导航

APP 下载