摘要
本申请提供了一种基于多解码头的自回归图像生成方法及装置,该方法包括:在初始的自回归模型上增加若干个并行解码头;利用历史图像集作为训练样本集输入到若干个并行解码头进行训练,得到训练好的若干个并行解码头;将待识别图像输入到训练好的若干个并行解码头中,利用训练好的若干个并行解码头在模型推理过程中预测若干个视觉词元的位置,得到目标预测结果;基于目标预测结果,利用投机解码策略对若干个视觉词元进行解码操作,得到若干个视觉词元对应的目标自回归图像。本申请在保证自回归图像生成质量和多样性预训练模型的情况下,加速自回归文本生成图像,提高图像生成质量,减少自回归模型的训练资源消耗,降低计算成本。
技术关键词
图像生成方法
码头
视觉
训练样本集
计算机装置
文本生成图像
分词
图像生成装置
可读存储介质
预训练模型
策略
解码单元
处理器通信
指令
存储器
参数