摘要
一种基于扩散模型的免训练参考图像引导的图像编辑方法,包括:图像预处理阶段,对原始图像与参考图像进行分辨率标准化,生成文本提示词并提取目标物体的二进制掩码;图像反演阶段,通过确定性加噪算法将图像编码为初始噪声潜在变量;图像生成阶段,利用改进的自注意力计算模块分阶段引导生成编辑图像,包括初始化布局阶段保留原始特征、编辑阶段动态估计掩码并融合参考图像键值特征实现目标注入,以及细节合成阶段优化区域一致性。该方法无需训练即可自动定位编辑区域并注入参考物体特征,并且可以保留原始图像的特征,解决传统方法需要用户通过涂抹来指定编辑区域以及需要花费大量成本训练模型的缺陷。
技术关键词
图像编辑方法
变量
注意力
查询特征
键值
分阶段
图像编码
文本
图像分割模型
物体
噪声
反演算法
计算机程序产品
生成方式
键特征
解码
布局