基于预训练扩散模型的多粒度提示金属表面缺陷图像合成方法

正文

推荐专利

申请号：CN202510516518

申请日期：2025-04-23

公开号：CN120451071A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开一种基于预训练扩散模型的金属表面缺陷图像可控合成方法，属于金属表面缺陷数据增强技术领域，是一种针对现有缺陷数据不足、标注成本高问题的一种多粒度提示生成方案。本发明方法包括：对金属表面缺陷图像进行多精度标注，构建多粒度训练集；基于预训练Stable Diffusion模型，设计精度编码掩膜金字塔，通过多级下采样生成分层控制信号，结合CLIP语义编码融合类别与位置信息，分层注入去噪UNet以控制缺陷生成；采用迁移学习策略冻结VAE与CLIP模块，仅微调去噪网络及掩膜编码层；用户通过粗粒度掩膜与类别提示生成多样缺陷图像。该方法突破传统生成模型对精细标注的依赖，实现缺陷位置、形状及类别的灵活控制，提升检测系统的泛化能力。

技术关键词

金属表面缺陷编码掩膜层级精度表面缺陷图像迁移学习策略分层优化噪声金字塔结构文本编码器分辨率耦合特征预训练模型语义向量多边形

系统为您推荐了相关专利信息

一种基于知识图谱的文档自动编目方法及系统

编目方法目录构建知识图谱编目系统节点

用于硅光芯片耦合测试的光纤位姿调整方法和系统

硅光芯片光纤随机梯度下降坐标功率值

一种大尺寸高精度DLP多光机投影拼缝消除和能量均化方法

DLP光机大尺寸高精度均化方法拼接区图像切片

一种用于混合键合设备的振动抑制装置及混合键合方法

振动抑制装置键合设备振动组件混合键合方法压电电机

一种耳鼻咽喉科的内镜一体化智能检查方法及系统

智能检查系统智能检查方法操控手柄喷雾装置嵌入式软件模块

基于预训练扩散模型的多粒度提示金属表面缺陷图像合成方法

站点导航

APP 下载