图像生成模型的训练、图像生成方法、装置、介质及设备

AITNT
正文
推荐专利
图像生成模型的训练、图像生成方法、装置、介质及设备
申请号:CN202510010623
申请日期:2025-01-03
公开号:CN120087415A
公开日期:2025-06-03
类型:发明专利
摘要
本申请的实施例提供了一种图像生成模型的训练、图像生成方法、装置、介质及设备。图像生成模型包括多模态文本处理模块以及主模型,该训练方法包括:获取训练数据,其包括真实图像及其对应的多语言版本的文本描述;通过多模态文本处理模块对文本描述进行特征提取,得到文本特征;利用自编码器图片处理模块对真实图片进行编码,得到对应的图像编码;将文本特征以及图像编码作为主模型的输入,以使主模型生成对应的预测图像,并通过最小化预测图像与真实图像之间的重建损失以优化主模型的性能。本申请实施例的技术方案可以在准确理解不同语言的文本输入的同时,提高图像生成模型对长文本输入的处理能力,进而保证图像生成模型所生成的图像的准确性。
技术关键词
图像生成模型 图像编码 文本 多模态 图像生成方法 图像重建 随机噪声 图片 训练装置 图像生成装置 编码器 大语言模型 处理器 编码模块 数据 存储装置 介质
系统为您推荐了相关专利信息
1
一种促进仿生设计理解与推理的教学方法、系统及电子设备
教学方法 三元组 关键词 仿生功能 交互模型
2
智能生成播客的方法和相关装置
展示控件 生成音频内容 指令 编辑 消息
3
基于传感器网络的城区道路疏散照明环境感知提升方法
疏散照明 多模态环境 参数 照明单元 网络
4
一种财务票据自动识别生成和决策方法及系统
局部视觉特征 全局视觉特征 票据自动识别 编码向量 决策方法
5
网点客服工单数据处理方法、装置及设备
客服工单 数据处理方法 工作量信息 文本 时效性
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号