摘要
本发明公开了一种基于深度学习的多尺度多视角目标相似性分析方法,涉及信息感知与识别技术领域。本发明对已有成对图像进行预处理得到模型输入数据;将处理后的数据分别输入基于ResNet50的特征提取通路和基于预训练视觉大模型的特征编码通路,在充分学习图像对本身的特征信息的同时,有效利用了大模型直接推理得到的鲁棒性特征,并进行特征融合,以此构建一种双通路的特征提取结构,通过一定迭代次数的优化,得到一组最优的模型参数;对训练好的模型进行推理,得到输入成对图像的相似性结果。本发明能在充分学习图像对本身的特征信息的同时,利用预训练大模型推理得到的鲁棒性特征,在不过分消耗计算资源的情况下,有效提高模型识别精度。
技术关键词
相似性分析方法
训练神经网络模型
多视角
识别神经网络
鲁棒性特征
Softmax函数
多尺度
误差反向传播
编码结构
视觉
数据
网络架构
图像处理
参数
支路
标签
频率