摘要
本发明公开了基于神经网络的图像背景相似度匹配方法、装置及设备,涉及图像处理技术领域,方法包括:使用预训练的人像抠图模型对输入图像进行处理,得到去除人像前景图像,进行图像块切分,并生成图像块掩码,确定需要掩盖的人像区域;将去除人像前景图像与图像块掩码输入视觉ViT模型进行编码,得到高维特征向量;将高维特征向量输入深度神经网络,映射到低维语义空间,得到低维背景特征向量;根据低维背景特征向量计算两张图像的背景相似度分数,根据背景相似度分数判断两张图像是否具有相似背景。通过去除前景、基于复杂度自适应的动态图像块切分策略以及视觉ViT模型生成的低维背景特征向量,提升图像背景相似度匹配的准确性和效率。
技术关键词
高维特征向量
图像块
深度神经网络
视觉
纹理特征
频域特征
复杂度
强度
多头注意力机制
编码模块
语义
前馈神经网络
动态网格
电子设备
生成代表
图像处理技术
多层感知机
图像重建
编码器
系统为您推荐了相关专利信息
视觉保真度
机器学习模型
图像编码器
图像压缩
通信信道
生成方法
生成高分辨率
缓冲特征
多源特征
坐标系
缺陷分析
缺陷预测
图像
滑动部件
傅里叶变换处理
重复定位方法
多模态传感器
夹具单元
智能感知模块
模块化夹具