摘要
本申请涉及人工智能技术领域,特别是涉及一种基于潜在扩散模型的局部图像替换方法、设备及存储介质。方法包括:对源图像和参考图像进行图像预处理和多模态特征识别,得到多模态特征信息和遮罩图;获取文本提示词,对文本提示词进行编码,得到提示词向量;基于源图像、参考图像、遮罩图、多模态特征信息和提示词向量进行编码,生成初始潜在表示;基于采样参数链和提示词向量对初始潜在表示进行迭代采样和去噪,得到最终潜在表示;基于最终潜在表示进行解码,生成目标图像。本申请的方法,基于潜在扩散模型实现了对源图像上目标区域的自动化、高一致性替换,显著提升了设计效率和图像质量,且生成结果与源图像风格一致。
技术关键词
多模态特征
图像替换方法
计算机存储介质
误差信息
编码器结构
解码器结构
文本
人工智能技术
参数
采样方法
种子数
处理器通信
基线
像素
指令
风格
系统为您推荐了相关专利信息
面向多源异构数据
清洗方法
空间位置偏差
计算机可执行指令
策略
机器人控制方法
终点
机器人控制装置
偏差
计算机可读指令
噪声特征
噪声预测模型
图像去噪方法
空洞
神经网络卷积层