摘要
本公开提供了基于大模型的图像生成方法、模型训练方法、装置及设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型技术领域,可应用于AIGC基于人工智能的内容生成场景。具体实现方案为:响应于图像生成请求,分别对图像生成请求包括的初始图像和描述文本进行特征编码,得到第一图像特征和第一文本特征,初始图像和描述文本均与目标对象相关;对第一图像特征和第一文本特征进行特征融合,得到融合特征;以及基于第一图像特征、第一文本特征和融合特征,对初始图像进行补全,生成目标图像。
技术关键词
文本
融合特征
图像生成方法
模型训练方法
编码特征
解码
关键词
样本
对象
编码模块
图像生成装置
模型训练装置
处理器
人工智能技术
生成场景
计算机
标签
系统为您推荐了相关专利信息
分类方式
文本处理装置
预测类别
文本处理方法
训练摘要生成模型
预训练语言模型
特征融合网络
文本
实体
多层次特征提取
搜索方法
搜索系统
患者
搜索模块
医院信息管理系统