摘要
本发明公开了一种基于扩散模型的零样本快速物体迁移方法,包括:获取参考图像和场景图像;将参考图像输入到预设分割检测模型中,获取参考图像中的目标物体;提取高频区域,对齐到场景图像中作为场景融合图;提取多级高分辨率特征图;获取目标物体的身份特征向量;将目标物体的身份特征向量注入到扩散模型中;将多级高分辨率特征图注入到扩散模型的解码器中;生成合成图像的特征图;通过变分自编码器实现图像解码,得到最终的合成图像。本发明能够快速且准确地将目标物体放置到场景图像中的所需位置,本发明具有高度可控性,易于扩展到多物体的组合,多样性强,能够确保物体身份的一致性,在零样本设置下能够实现快速物体迁移。
技术关键词
迁移方法
物体
注意力
文本编码器
图像编码器
图像块
参数化特征
场景
噪声图像
样本
前馈神经网络
身份
矩阵
高频特征
多层次特征
输入解码器
条件随机场
系统为您推荐了相关专利信息
自动调焦方法
激光雷达
深度值
调焦误差
生成点云数据
三维环境模型
双臂机器人
动态障碍物
自主导航方法
注意力
多头注意力机制
路径规划系统
深度强化学习
节点
强化学习框架