摘要
一种多视角目标图像融合方法、装置、设备及可读存储介质,多视角目标图像融合方法包括:对每张图像相对拍摄位置的方位角、俯仰角及距离进行空间位置编码,将得到的每张图像的空间位置编码与对应的图像块嵌入向量进行拼接;以所有空间图像块嵌入向量组成空间图像块嵌入序列,并在空间图像块嵌入序列的最前端添加可学习的分类标记,得到新的空间图像块嵌入序列;将新的空间图像块嵌入序列输入Transformer模型,基于代理注意力机制提取所有空间图像块嵌入向量中的全局信息更新可学习的分类标记,得到融合后的分类标记;使用融合后的分类标记,通过多层感知机对目标进行类别预测。通过本申请,能够提升模型对目标识别的准确性。
技术关键词
图像块
图像融合方法
多视角
图像融合装置
标记
多层感知机
方位角
图像融合设备
注意力机制
序列
信息更新
编码
可读存储介质
处理器
线性
拼接模块
算法