一种红外耦合编辑扩散生成模型的训练方法

AITNT
正文
推荐专利
一种红外耦合编辑扩散生成模型的训练方法
申请号:CN202510205478
申请日期:2025-02-24
公开号:CN120182744A
公开日期:2025-06-20
类型:发明专利
摘要
本申请涉及计算机视觉技术领域,特别涉及一种红外耦合编辑扩散生成模型的训练方法,包括:将样本纯净红外目标图像输入至总体特征提取器中,通过令牌的方式,将样本纯净红外目标图像分别编码为全局令牌和补丁令牌,将两种令牌进行拼接后再对齐到训练所需的潜空间中,得到总体特征;通过高通滤波、小波变换、或离散余弦变换对样本纯净红外目标图像进行处理,得到高频映射图,将高频映射图贴合到样本背景图像的指定位置后输入至细节特征提取器中,得到细节特征;构建红外耦合编辑扩散生成模型,将总体特征和细节特征一起注入到红外耦合编辑扩散生成模型中进行训练,从而快速训练得到能够调控目标形状和姿态的红外耦合编辑扩散生成模型。
技术关键词
编辑 样本 令牌 特征提取器 图像 离散余弦变换 噪声 补丁 学生 教师 解码器 编码器 模组 知识蒸馏方法 监督学习方法 网络 计算机视觉技术 处理器 高通滤波器 学习特征
系统为您推荐了相关专利信息
1
基于大语言模型的图片编辑方法、装置和计算机设备
大语言模型 图片编辑方法 对象 图像识别算法 边缘检测算法
2
一种仿生复合清洁机器人系统
清洁机器人系统 避障模块 图像识别单元 拍摄单元 激光雷达
3
基于模式识别的眼底图像诊断分析系统及方法
眼底彩照 颜色直方图 结构多尺度 多模态特征融合 融合语义
4
人脸鉴伪方法、装置、设备及计算机程序产品
鉴伪方法 分支 计算机程序产品 鉴伪设备 网络
5
基于多维几何特征的RGB-D惯性位姿估计方法、系统及设备
位姿估计方法 路标 投影残差 结合点特征 因子
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号