摘要
本发明公开一种基于掩码引导的混凝土缺陷图像生成方法,适用于小样本条件下混凝土裂缝等缺陷图像的数据增强与结构化图像合成任务。该方法通过引入空间掩码机制,从参考图像中精确定位并提取缺陷区域,有效提升缺陷特征的注入准确性与控制粒度。该方法包括三个主要阶段:多尺度主题‑背景特征提取阶段、自适应时间特征生成阶段以及多尺度交叉注意力图像去噪阶段。在特征提取阶段,通过对参考图像与主题文本进行空间注意力增强与细粒度语义对齐,实现多模态特征的统一表示;在时间特征生成阶段,引入特征自适应时间,生成时间步相关权重以动态调控主题与背景特征的融合比例;在图像去噪阶段,结合UNet与交叉注意力完成引导去噪与图像生成。
技术关键词
混凝土缺陷
图像生成方法
主题特征
噪声特征
交叉注意力机制
阶段
多层感知机
语义
残差模块
文本编码器
执行噪声
上采样
残差结构
多尺度特征提取
系统为您推荐了相关专利信息
读码相机
卷烟设备
参数估计模型
图片
卷烟生产线
监测点
异构数据处理
变形监测数据
交叉注意力机制
多源异构数据