摘要
本发明提供了图像处理方法、多模态图像生成模型的训练方法及装置,图像处理方法包括:将待处理文本输入至预先训练好的多模态图像生成模型中,输出目标缺陷图像;多模态图像生成模型为稳定扩散模型和目标LoRA模型相结合的模型;目标LoRA模型用于微调稳定扩散模型的权重参数;目标LoRA模型为与缺陷特征信息所属缺陷类别相匹配的模型。该方式中,由于目标LoRA模型为与缺陷特征信息所属缺陷类别相匹配的模型,因此,通过该目标LoRA模型和稳定扩散模型相结合的多模态图像生成模型,可以使生成的目标缺陷图像中准确包含该缺陷特征信息所描述的缺陷,提高了生成目标缺陷图像的便利性、可控性,进而可以提供满足需求的缺陷图像数量。
技术关键词
图像生成模型
缺陷类别
样本
标签
图像处理方法
多模态
分类方式
项目
缺陷尺寸
基础
训练装置
参数
处理器
输出模块
存储器
电子设备
指令
文本
系统为您推荐了相关专利信息
命名实体模型
命名实体识别方法
三元组
多模态
文本
泡沫铝材料
微观结构检测方法
LED灯具
散光
卷积神经网络识别
数据融合装置
异构数据融合方法
语义向量
模型预训练
多模态