摘要
本申请实施例公开了一种针对图像的模型训练方法及装置。包括:获取包括多个第一图像样本的第一训练数据;利用第一训练数据对图像编码器进行预训练,其中利用图像编码器对第一图像样本进行第一编码,得到第一图像样本的第一隐空间表示,对第一隐空间表示进行切分得到多个分块,对部分分块对应的隐空间表示进行掩码处理得到掩码块,对未掩码的分块进行第二编码,得到未掩码的分块对应的特征表示;将未掩码的分块对应的特征表示和掩码块输入第一解码器进行解码,得到第一图像样本的第二隐空间表示;预训练目标包括:最小化第一隐空间表示和第二隐空间表示之间的差异。利用预训练得到的图像编码器构建图像处理模型后,能够大幅度加快模型的收敛速度。
技术关键词
图像编码器
图像处理模型
分块
样本
图像生成模型
噪声图像
模型训练方法
注意力机制
图像分类模型
解码器
分类网络
数据
模型训练装置
微调单元
计算机程序产品
因子
系统为您推荐了相关专利信息
生物标志物
脊髓栓系综合征
变性梯度凝胶电泳
样本
基因检测技术
噪声特征
图像生成模型
图像生成方法
样本
图像特征值
图像生成模型
基准特征
排布方式
偏好特征
生成方法