图像处理方法、多模态图像生成模型的训练方法及装置

正文

推荐专利

申请号：CN202411074050

申请日期：2024-08-07

公开号：CN118608901B

公开日期：2024-12-17

类型：发明专利

摘要

本发明提供了图像处理方法、多模态图像生成模型的训练方法及装置，图像处理方法包括：将待处理文本输入至预先训练好的多模态图像生成模型中，输出目标缺陷图像；多模态图像生成模型为稳定扩散模型和目标LoRA模型相结合的模型；目标LoRA模型用于微调稳定扩散模型的权重参数；目标LoRA模型为与缺陷特征信息所属缺陷类别相匹配的模型。该方式中，由于目标LoRA模型为与缺陷特征信息所属缺陷类别相匹配的模型，因此，通过该目标LoRA模型和稳定扩散模型相结合的多模态图像生成模型，可以使生成的目标缺陷图像中准确包含该缺陷特征信息所描述的缺陷，提高了生成目标缺陷图像的便利性、可控性，进而可以提供满足需求的缺陷图像数量。

技术关键词

图像生成模型缺陷类别样本标签图像处理方法多模态分类方式项目缺陷尺寸基础训练装置参数处理器输出模块存储器电子设备指令文本

系统为您推荐了相关专利信息

一种烟支缺陷检测方法、系统、介质及电子设备

缺陷检测方法烟支抑制算法缺陷类别聚类算法

多模态命名实体识别方法、装置以及计算机设备

命名实体模型命名实体识别方法三元组多模态文本

一种城市多模态交通流量预测方法及装置

多模态样本交通流量预测方法数据模块

一种采用深度学习的泡沫铝微观结构检测方法及系统

泡沫铝材料微观结构检测方法 LED灯具散光卷积神经网络识别

用于AI大模型预训练的异构数据融合装置、方法及介质

数据融合装置异构数据融合方法语义向量模型预训练多模态

图像处理方法、多模态图像生成模型的训练方法及装置

站点导航

APP 下载