摘要
本申请提供一种图像目标修复方法、装置、设备、存储介质,该方法包括:获取包括修复区域的图像、文本提示和二进制遮掩码;文本提示用于描述修复区域中的目标对象;二进制遮掩码用于指示待修复区域;根据二进制遮掩码确定图像的遮罩图像;根据文本提示和遮罩图像,推断目标对象的修复后特征;将修复后特征作为视觉提示,引导扩散模型生成目标对象。本申请提供的方法,基于修复区域的图像、文本提示和二进制遮掩码,推断目标对象的修复后特征,进而将修复后特征作为视觉提示,引导扩散模型生成目标对象,使得生成的目标对象与文本提示一致,且不存在明显的伪影,高保真。
技术关键词
注意力
语义特征
文本
图像
对象
适配器
修复方法
视觉特征
模块
重构
修复装置
处理器
可读存储介质
存储器
编码
标识
电子设备
计算机
系统为您推荐了相关专利信息
面部表情识别模型
图像类别
细粒度特征
语义
深度学习模型
三维可视化模型
融合特征
高斯滤波方法
对象
数据
化优化方法
卷积神经网络提取特征
多模态
文本
跨模态
深度卷积神经网络模型
优化控制方法
参数
瓶颈
零件