摘要
本发明公开了一种模拟人眼视觉感知模式的图像处理方法,包括对所获取的目标图像进行预处理得到标准化输入图像;构建视觉变换器模型,进行特征提取;构建与目标图像理解任务相对应的任务模型,将特征提取结果输入至任务模型,得到初始预测结果;比较初始预测结果与实际结果的差异,构建损失函数;采用反向传播算法对任务模型进行梯度更新,完成训练;将待预测的测试目标图像输入至任务模型中,得到模拟人眼视觉感知模式的图像。本发明有效模拟了人眼视觉的聚焦感知模式,增强了视觉变换器模型的特征提取能力,并避免了去除自注意力机制可能导致的精度损失,具有更强的鲁棒性和泛化能力。
技术关键词
模拟人眼视觉
图像处理方法
分类任务模型
注意力
工业缺陷检测
前馈神经网络
位置编码器
实例分割
二维图像特征
传播算法
模式
变换器模块
归一化模块
采样模块
动态
双线性插值方法