基于预训练扩散模型的多粒度提示金属表面缺陷图像合成方法

AITNT
正文
推荐专利
基于预训练扩散模型的多粒度提示金属表面缺陷图像合成方法
申请号:CN202510516518
申请日期:2025-04-23
公开号:CN120451071A
公开日期:2025-08-08
类型:发明专利
摘要
本发明公开一种基于预训练扩散模型的金属表面缺陷图像可控合成方法,属于金属表面缺陷数据增强技术领域,是一种针对现有缺陷数据不足、标注成本高问题的一种多粒度提示生成方案。本发明方法包括:对金属表面缺陷图像进行多精度标注,构建多粒度训练集;基于预训练Stable Diffusion模型,设计精度编码掩膜金字塔,通过多级下采样生成分层控制信号,结合CLIP语义编码融合类别与位置信息,分层注入去噪UNet以控制缺陷生成;采用迁移学习策略冻结VAE与CLIP模块,仅微调去噪网络及掩膜编码层;用户通过粗粒度掩膜与类别提示生成多样缺陷图像。该方法突破传统生成模型对精细标注的依赖,实现缺陷位置、形状及类别的灵活控制,提升检测系统的泛化能力。
技术关键词
金属表面缺陷 编码掩膜 层级 精度 表面缺陷图像 迁移学习策略 分层 优化噪声 金字塔结构 文本编码器 分辨率 耦合特征 预训练模型 语义向量 多边形
系统为您推荐了相关专利信息
1
一种基于知识图谱的文档自动编目方法及系统
编目方法 目录 构建知识图谱 编目系统 节点
2
用于硅光芯片耦合测试的光纤位姿调整方法和系统
硅光芯片 光纤 随机梯度下降 坐标 功率值
3
一种大尺寸高精度DLP多光机投影拼缝消除和能量均化方法
DLP光机 大尺寸高精度 均化方法 拼接区图像 切片
4
一种用于混合键合设备的振动抑制装置及混合键合方法
振动抑制装置 键合设备 振动组件 混合键合方法 压电电机
5
一种耳鼻咽喉科的内镜一体化智能检查方法及系统
智能检查系统 智能检查方法 操控手柄 喷雾装置 嵌入式软件模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号