基于2D-FFT的分频量化变分自编码器的图像生成方法及系统

AITNT
正文
推荐专利
基于2D-FFT的分频量化变分自编码器的图像生成方法及系统
申请号:CN202510003356
申请日期:2025-01-02
公开号:CN119941894A
公开日期:2025-05-06
类型:发明专利
摘要
本发明公开了基于2D‑FFT的分频量化变分自编码器的图像生成方法及系统,涉及图像生成技术领域;其包括编码器、量化器、解码器,编码器首先将输入图像通过傅里叶变换使特征迁移至频域,然后通过不同的滤波器将频域特征映射为多个连续分量的集合;量化器主要维护一个维度为N的码本,该码本在训练之后与上述连续分量互相优化,然后通过最近邻替换的方式将连续分量量化为离散分量;解码器通过图卷积模块产生一组离散分量的修正权值,修正后经过逆傅里叶变换迁移至空域,最后通过连续的上采样将特征恢复至原始空间,完成图像生成。本申请能够更全面地捕捉图像中的复杂结构和细节,在图像生成的实际应用中具有更高的准确性。
技术关键词
图像生成方法 二维快速傅里叶变换 频域特征 编码器 动态更新 皮尔逊相关系数 图像编码 卷积模块 离散特征 频率 图像生成技术 图像生成系统 量化器 全局平均池化 滤波器系数 代表 多层感知机 解码器
系统为您推荐了相关专利信息
1
基于神经网络的激光除漆声学监测方法、装置
激光除漆 声学监测方法 分类神经网络 神经网络模型 频域特征
2
基于对抗自动编码器的运动想象脑机接口自适应分类方法
运动想象脑机接口 运动想象脑电信号 解码模型 分类方法 深度神经网络
3
一种基于上消化道时序信息的部位识别方法
识别方法 输出特征 时序特征 文本 融合图像特征
4
一种基于强化学习的多模态诊断治疗方案推荐系统
医学影像特征 推荐系统 加权特征 文本 特征提取单元
5
基于掩码引导的查询式编码器框架的图像篡改定位方法和系统
编码器框架 图像篡改定位方法 噪声特征 多模态特征 令牌
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号