摘要
本发明涉及机器学习技术领域,尤其涉及一种基于频域自回归的图像生成方法、装置、电子设备及计算机可读存储介质,其中,方法包括:对输入图像执行离散余弦变换,获得频谱密度矩阵;将频谱密度矩阵分解为多级子图像,并按照预设值排序;利用逆离散余弦变换将多级子图像重建为空间域子图像,并利用嵌套频谱令牌化模块将空间域子图像编码为一维因果令牌序列;基于频谱能量长尾分布,对一维因果令牌序列进行分配处理,并引入因果频谱掩码;将分配处理后的一维因果令牌序列执行自回归令牌预测,并重建对应子图像。通过嵌套频谱令牌化、非均匀令牌‑频率映射及因果频谱掩码,实现高效、严格因果且细节丰富的视觉生成。
技术关键词
图像生成方法
离散余弦变换
令牌
计算机执行指令
图像编码
图像重建
序列
密度
可读存储介质
图像生成装置
嵌套
机器学习技术
电子设备
模块
掩码矩阵
处理器通信
存储器
系统为您推荐了相关专利信息
语义主题
视频帧
融合特征
视频摘要生成方法
语义特征提取
采样模块
采样电路
控制开关
采样点
计算机执行指令