一种基于去噪扩散一致性模型采样的两阶段非刚性图像编辑方法

正文

推荐专利

申请号：CN202510539031

申请日期：2025-04-27

公开号：CN120431206A

公开日期：2025-08-05

类型：发明专利

摘要

一种基于去噪扩散一致性模型采样的两阶段非刚性图像编辑方法，包括：通过预训练的潜在一致性模型LCM对原图像进行重建，提取并保存原图像的交叉注意力图和自注意力图；第一阶段：在目标文本引导下，将原图像的交叉注意力图注入到编辑过程的交叉注意力层中，生成中间图像，以调整对象的动作或姿态并保留原图像的空间布局；第二阶段：将原图像的自注意力层的键和值注入到中间图像的自注意力层中，生成最终目标图像，以保留原对象的身份属性特征；第一和第二阶段仅通过调整采样过程实现非刚性编辑，且交叉注意力与自注意力的注入分阶段独立控制，从而避免相互干扰。本发明的方法在权衡文本忠实度与编辑前后的高级语义信息一致性方面优势显著。

技术关键词

注意力图像编辑方法图像重建对象属性特征序列比对算法分阶段文本计算机程序产品随机噪声可读存储介质校准身份处理器语义布局变量

系统为您推荐了相关专利信息

基于轻量化深度学习的牛肉新鲜度检测方法、设备及介质

牛肉新鲜度牛肉图像深度学习模型注意力金字塔池化模块

一种多聚焦图像融合方法及系统

图像融合方法多级卷积神经网络多通道特征卷积滤波器特征提取器

一种医用灭菌器灭菌时间补偿方法及系统

医用灭菌器时间补偿方法液体局部二值模式灰度共生矩阵

一种药包字体识别与整理方法及系统

字符颈部结构多尺度特征整理方法内容显示

一种基于AIGC的疗愈音乐生成方法及系统

音乐生成方法文本矢量量化大语言模型交叉注意力机制

一种基于去噪扩散一致性模型采样的两阶段非刚性图像编辑方法

站点导航

APP 下载