一种基于去噪扩散一致性模型采样的两阶段非刚性图像编辑方法

AITNT
正文
推荐专利
一种基于去噪扩散一致性模型采样的两阶段非刚性图像编辑方法
申请号:CN202510539031
申请日期:2025-04-27
公开号:CN120431206A
公开日期:2025-08-05
类型:发明专利
摘要
一种基于去噪扩散一致性模型采样的两阶段非刚性图像编辑方法,包括:通过预训练的潜在一致性模型LCM对原图像进行重建,提取并保存原图像的交叉注意力图和自注意力图;第一阶段:在目标文本引导下,将原图像的交叉注意力图注入到编辑过程的交叉注意力层中,生成中间图像,以调整对象的动作或姿态并保留原图像的空间布局;第二阶段:将原图像的自注意力层的键和值注入到中间图像的自注意力层中,生成最终目标图像,以保留原对象的身份属性特征;第一和第二阶段仅通过调整采样过程实现非刚性编辑,且交叉注意力与自注意力的注入分阶段独立控制,从而避免相互干扰。本发明的方法在权衡文本忠实度与编辑前后的高级语义信息一致性方面优势显著。
技术关键词
注意力 图像编辑方法 图像重建 对象属性特征 序列比对算法 分阶段 文本 计算机程序产品 随机噪声 可读存储介质 校准 身份 处理器 语义 布局 变量
系统为您推荐了相关专利信息
1
基于轻量化深度学习的牛肉新鲜度检测方法、设备及介质
牛肉新鲜度 牛肉图像 深度学习模型 注意力 金字塔池化模块
2
一种多聚焦图像融合方法及系统
图像融合方法 多级卷积神经网络 多通道特征 卷积滤波器 特征提取器
3
一种医用灭菌器灭菌时间补偿方法及系统
医用灭菌器 时间补偿方法 液体 局部二值模式 灰度共生矩阵
4
一种药包字体识别与整理方法及系统
字符 颈部结构 多尺度特征 整理方法 内容显示
5
一种基于AIGC的疗愈音乐生成方法及系统
音乐生成方法 文本 矢量量化 大语言模型 交叉注意力机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号