摘要
本发明属于图像处理技术领域,公开了一种基于扩散模型的无掩码图像合成方法及系统,包括:将背景图像和包含目标对象的噪声图像输入至预训练的潜在扩散模型中,潜在扩散模型在条件向量的引导下执行反向去噪过程,以将目标对象自适应地合成在中,得到合成图像;其中,条件向量的获取方式包括:将包含目标对象的参考图像编码为对象嵌入向量,并根据生成一组可学习的背景提示词;将和背景提示词拼接;将拼接后的特征表示进行空间映射,得到条件向量。本发明能够克服现有图像合成技术中存在的流程繁琐、效率低下、需要大量手动干预、合成结果缺乏真实感与和谐性、尤其是前景对象无法根据背景环境进行自适应调整等缺陷。
技术关键词
模型预训练
噪声图像
对象
可读存储介质
图像修复技术
交叉注意力机制
三元组
图像编码器
网络
图像处理技术
多层感知机
解码器
计算机程序产品
数据
处理器
系统为您推荐了相关专利信息
患者筛选方法
云平台
微信公众号
医疗数据处理技术
智能化数据分析
管理策略
动态规划算法
能耗
历史运行数据
城轨车辆
相位解缠方法
多通道
干涉合成孔径雷达
模数
数据
配电网潮流优化
优化约束条件
拉夫逊法潮流
遗传算法
序列