一种基于语义嵌入和偏好建模的可控图像生成方法

正文

推荐专利

申请号：CN202411556413

申请日期：2024-11-04

公开号：CN119478093A

公开日期：2025-02-18

类型：发明专利

摘要

本发明公开了一种基于语义嵌入和偏好建模的可控图像生成方法，包括以下步骤：S1:利用图文对数据集微调大语言模型；其中，所述图文对数据集包括若干三元组，每个三元组包括输入图像、指令文本和生成图像；S2:利用微调后的大语言模型和图像重建优化指令文本嵌入；S3:利用优化后的指令文本嵌入微调预训练图像生成模型；S4:利用偏好模型优化微调后的预训练图像生成模型；其中，偏好模型基于标注有排名数据的生成图像训练获得；S5:利用优化后的预训练图像生成模型，获得与待处理指令文本、待处理输入图像匹配的生成图像。通过本发明方法生成的图像更符合人类的审美和价值观，且在各种噪声条件下都能稳定地生成高质量的输入图像和指令文本相关联的图像。

技术关键词

图像生成模型图像生成方法文本编码器指令大语言模型语义图像匹配三元组 sigmoid函数图像重建随机噪声图文噪声条件输入端线性数据参数

系统为您推荐了相关专利信息

储能系统的智能温控方法、温控装置、储能系统

储能系统智能温控方法策略剩余时长环境温度信息

支付处理方法和装置、电子设备、计算机可读存储介质

虚拟卡实体支付卡卡片建立关联关系

基于AIGC实现企业服务资产智能分类处理的系统、方法、装置、处理器及可读存储介质

资产数据采集模块计算机可执行指令分类服务企业

一种热门查询的索引方法及装置

索引方法画像分层聚类算法语义向量索引装置

一种基于不规则动态字幕智能提取版权信息的方法

字幕置信度阈值动态实体大语言模型

一种基于语义嵌入和偏好建模的可控图像生成方法

站点导航

APP 下载