一种基于语义嵌入和偏好建模的可控图像生成方法

AITNT
正文
推荐专利
一种基于语义嵌入和偏好建模的可控图像生成方法
申请号:CN202411556413
申请日期:2024-11-04
公开号:CN119478093A
公开日期:2025-02-18
类型:发明专利
摘要
本发明公开了一种基于语义嵌入和偏好建模的可控图像生成方法,包括以下步骤:S1:利用图文对数据集微调大语言模型;其中,所述图文对数据集包括若干三元组,每个三元组包括输入图像、指令文本和生成图像;S2:利用微调后的大语言模型和图像重建优化指令文本嵌入;S3:利用优化后的指令文本嵌入微调预训练图像生成模型;S4:利用偏好模型优化微调后的预训练图像生成模型;其中,偏好模型基于标注有排名数据的生成图像训练获得;S5:利用优化后的预训练图像生成模型,获得与待处理指令文本、待处理输入图像匹配的生成图像。通过本发明方法生成的图像更符合人类的审美和价值观,且在各种噪声条件下都能稳定地生成高质量的输入图像和指令文本相关联的图像。
技术关键词
图像生成模型 图像生成方法 文本编码器 指令 大语言模型 语义 图像匹配 三元组 sigmoid函数 图像重建 随机噪声 图文 噪声条件 输入端 线性 数据 参数
系统为您推荐了相关专利信息
1
储能系统的智能温控方法、温控装置、储能系统
储能系统 智能温控方法 策略 剩余时长 环境温度信息
2
支付处理方法和装置、电子设备、计算机可读存储介质
虚拟卡 实体 支付卡 卡片 建立关联关系
3
基于AIGC实现企业服务资产智能分类处理的系统、方法、装置、处理器及可读存储介质
资产 数据采集模块 计算机可执行指令 分类服务 企业
4
一种热门查询的索引方法及装置
索引方法 画像 分层聚类算法 语义向量 索引装置
5
一种基于不规则动态字幕智能提取版权信息的方法
字幕 置信度阈值 动态 实体 大语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号