图像生成模型的训练、图像生成方法、装置、介质及设备

正文

推荐专利

申请号：CN202510010623

申请日期：2025-01-03

公开号：CN120087415A

公开日期：2025-06-03

类型：发明专利

摘要

本申请的实施例提供了一种图像生成模型的训练、图像生成方法、装置、介质及设备。图像生成模型包括多模态文本处理模块以及主模型，该训练方法包括：获取训练数据，其包括真实图像及其对应的多语言版本的文本描述；通过多模态文本处理模块对文本描述进行特征提取，得到文本特征；利用自编码器图片处理模块对真实图片进行编码，得到对应的图像编码；将文本特征以及图像编码作为主模型的输入，以使主模型生成对应的预测图像，并通过最小化预测图像与真实图像之间的重建损失以优化主模型的性能。本申请实施例的技术方案可以在准确理解不同语言的文本输入的同时，提高图像生成模型对长文本输入的处理能力，进而保证图像生成模型所生成的图像的准确性。

技术关键词

图像生成模型图像编码文本多模态图像生成方法图像重建随机噪声图片训练装置图像生成装置编码器大语言模型处理器编码模块数据存储装置介质

系统为您推荐了相关专利信息

一种促进仿生设计理解与推理的教学方法、系统及电子设备

教学方法三元组关键词仿生功能交互模型

智能生成播客的方法和相关装置

展示控件生成音频内容指令编辑消息

基于传感器网络的城区道路疏散照明环境感知提升方法

疏散照明多模态环境参数照明单元网络

一种财务票据自动识别生成和决策方法及系统

局部视觉特征全局视觉特征票据自动识别编码向量决策方法

网点客服工单数据处理方法、装置及设备

客服工单数据处理方法工作量信息文本时效性

图像生成模型的训练、图像生成方法、装置、介质及设备

站点导航

APP 下载