一种无需图像的底层视觉预训练方法

正文

推荐专利

一种无需图像的底层视觉预训练方法

申请号：CN202411709948

申请日期：2024-11-27

公开号：CN119624833B

公开日期：2025-11-11

类型：发明专利

摘要

本发明涉及底层视觉预训练技术领域，公开了一种无需图像的底层视觉预训练方法，包括：从高斯分布中随机采样，得到纯高斯噪声图像；对纯高斯噪声图像执行频率感知掩蔽策略，得到输入图像；频谱信息重建预训练，对需要预训练的底层视觉模型的结构进行第一次修改；下游降质复原任务微调，保留预训练的第一次修改后的底层视觉模型的参数，并第二次修改底层视觉模型的结构，以进行下游任务的训练。本发明基于退化信息在频谱域上表现出的干扰模式的类别差异性，提出了频率感知掩蔽策略，打破了传统的从数据中学习任务通用信息的预训练范式，仅使用一张随机生成的高斯噪声图像，以极低的计算成本实现了退化类型不可知的通用可转移性表示学习。

技术关键词

预训练方法噪声图像视觉编码器模块掩膜模型预训练解码器策略重构频率图像重建三通道像素参数连续性矩阵阶段

一种无需图像的底层视觉预训练方法

站点导航

APP 下载