摘要
本公开关于一种文本生成图像的方法、装置、服务器及存储介质,所述方法包括:将用于生成图像的提示文本输入大语言模型进行处理,得到所述大语言模型中的每一个Transformer模块的输出结果;所述大语言模型为仅使用解码器结构的大语言模型,每一个Transformer模块采用的注意力机制为双向注意力机制,各个Transformer模块串联连接;通过聚合模块对各个Transformer模块的输出结果进行聚合,得到聚合结果;将所述聚合结果输入图像生成模型,得到所述提示文本对应的生成图像。本方法可提高图像生成模型的生成图像与输入的提示文本的一致性。
技术关键词
图像生成模型
大语言模型
文本生成图像
子模块
双向注意力机制
解码器结构
服务器
数据
图像生成单元
处理器
可读存储介质
计算机程序产品
处理单元
指令
变量
系统为您推荐了相关专利信息
信号输出方法
压力变送器
定时器
电信号
信号输出系统
库存管理系统
智能仓储
信号传播路径
指数
子模块
大语言模型
可视化方法
语句
数据可视化
可视化图表
故障分析方法
基站
故障知识库
大语言模型
意图识别