摘要
本申请涉及一种缺陷图像生成方法、装置、设备及存储介质,应用在人工智能领域,包括获取纯噪声图像、缺陷实物图像、原始缺陷图像、缺陷文本描述以及模板掩膜图像;利用ControlNet模型和扩散模型,根据原始缺陷图像、缺陷文本描述和模板掩膜图像基于纯噪声图像生成潜空间表示的缺陷潜空间图像;根据缺陷潜空间图像和缺陷实物图像,利用模板掩膜图像获取潜空间表示的缺陷目标特征和背景特征,并将缺陷目标特征和背景特征融合生成潜空间表示的潜空间融合特征;采用扩散模型对潜空间融合特征进行处理,并解码生成最终缺陷图像。本申请具有的技术效果是:解决工业缺陷图像长尾分布问题,提高缺陷图像质量。
技术关键词
模板掩膜
噪声图像
融合特征
图像生成方法
文本
图像获取模块
生成模板
噪声强度
图像生成装置
处理器
计算机设备
可读存储介质
存储器
解码器
编码器
网络
系统为您推荐了相关专利信息
大语言模型
多模态特征融合
对话策略
融合特征
排序算法
文本生成系统
语义特征
文本生成方法
高维向量空间
数据嵌入