摘要
本公开提供了一种基于大模型的图像生成及模型训练方法、装置和设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC基于人工智能的内容生成等场景。基于大模型的图像生成方法包括:对原始图像中前景内容对应的前景图像进行特征提取,以获得前景特征;对参考图像进行图文处理,以获得全局特征和文本特征;所述参考图像是基于待生成的背景内容的目标风格获取的;采用大模型,基于所述前景特征、所述全局特征和所述文本特征,生成包括所述前景内容和所述背景内容的目标图像。
技术关键词
注意力
图像生成模型
文本
融合特征
生成预测图像
网络
图像生成方法
模型训练方法
图文
噪声特征
模块
风格
样本
图像生成装置
处理器
人工智能技术
计算机程序产品
系统为您推荐了相关专利信息
基因预测方法
双向长短期记忆网络
深度神经网络融合
序列
上下文特征
依存句法
CRF模型
实体
Softmax函数
XML解析器
文本
视频生成模型
特征生成方法
数据
计算机程序产品