摘要
本申请涉及计算机视觉技术领域,特别涉及一种红外耦合编辑扩散生成模型的训练方法,包括:将样本纯净红外目标图像输入至总体特征提取器中,通过令牌的方式,将样本纯净红外目标图像分别编码为全局令牌和补丁令牌,将两种令牌进行拼接后再对齐到训练所需的潜空间中,得到总体特征;通过高通滤波、小波变换、或离散余弦变换对样本纯净红外目标图像进行处理,得到高频映射图,将高频映射图贴合到样本背景图像的指定位置后输入至细节特征提取器中,得到细节特征;构建红外耦合编辑扩散生成模型,将总体特征和细节特征一起注入到红外耦合编辑扩散生成模型中进行训练,从而快速训练得到能够调控目标形状和姿态的红外耦合编辑扩散生成模型。
技术关键词
编辑
样本
令牌
特征提取器
图像
离散余弦变换
噪声
补丁
学生
教师
解码器
编码器
模组
知识蒸馏方法
监督学习方法
网络
计算机视觉技术
处理器
高通滤波器
学习特征
系统为您推荐了相关专利信息
大语言模型
图片编辑方法
对象
图像识别算法
边缘检测算法
清洁机器人系统
避障模块
图像识别单元
拍摄单元
激光雷达
眼底彩照
颜色直方图
结构多尺度
多模态特征融合
融合语义