摘要
本说明书实施例提供了一种视觉内容生成方法及装置,该方法包括:获取用户指令信息和已生成的图像数据集合序列,用户指令信息用于指示视觉内容的生成,图像数据集合序列包括至少一个图像数据集合,图像数据集合包括多个图像数据,每个图像数据集合分别与视觉内容对应;基于用户指令信息和图像数据集合序列,由自回归大模型,预测得到下一个图像数据集合对应的视觉分布信息,视觉分布信息为连续域中的概率分布信息;基于下一个图像数据集合对应的视觉分布信息,进行连续域采样,得到下一个图像数据集合。
技术关键词
图像数据集合
视觉
序列
内容生成方法
视频帧
指令
样本
图像块
编码器
标识
图像分割
采样器
存储器
解码器
处理器