一种基于CLIP损失与感知损失的扩散模型LoRA微调优化方法及系统

正文

推荐专利

申请号：CN202510027124

申请日期：2025-01-08

公开号：CN119478587B

公开日期：2025-06-10

类型：发明专利

摘要

本发明提出了一种基于CLIP损失与感知损失的扩散模型LoRA微调优化方法及系统，所述方法包括：步骤1，在LoRA微调过程中，结合CLIP损失和感知损失，动态调整CLIP损失和感知损失的权重；步骤2，利用CLIP模型计算去噪后的中间图像与目标文本的语义相似度，并根据相似度差异优化扩散模型的噪声预测能力；步骤3，采用感知损失计算中间图像与目标图像在特征空间的差异，并优化扩散模型的噪声预测能力，提升生成图像的视觉质量与细节保真度；步骤4，根据训练进展调整是否启用CLIP损失和感知损失。通过引入CLIP损失，模型在微调训练过程中能够更好地将图像与文本进行对齐，使得生成的图像更加符合文本提示的描述。

技术关键词

特征提取网络噪声图像噪声预测解码器图像压缩语义加权损失函数感知损失函数尺寸滑动窗口梯度下降算法文本编码器参数图像编码器

系统为您推荐了相关专利信息

图像分类模型的训练方法及装置和图像分类方法及装置

图像分类模型噪声图像序列训练装置图像分类方法

基于蒙特卡洛模拟的供水管网独立计量分区调压控制系统

独立计量分区蒙特卡洛调压控制系统参数供水管

一种可解释极化深度学习网络的海水浮筏养殖信息提取方法

信息提取方法浮筏养殖深度学习网络解码器线性变换矩阵

一种基于视觉过滤机制的SAR图像任意方向舰船目标检测方法

检测网络模型过滤模块注意力机制特征提取网络特征融合网络

贝叶斯视角下基于不确定性量化的可信谣言检测方法

解码器 BERT模型前馈神经网络谣言检测方法贝叶斯神经网络

一种基于CLIP损失与感知损失的扩散模型LoRA微调优化方法及系统

站点导航

APP 下载