摘要
本申请公开了一种多目标跟踪方法、多目标跟踪装置、电子设备及存储介质,涉及计算机视觉技术领域。该方法包括:获取第一图像帧中检测对象的图像特征向量及文本特征向量,文本特征向量通过文本特征提取模块获得,文本特征提取模块是基于无文本标注的数据集训练得到的;获取图像特征向量与待匹配轨迹的图像特征模版之间的第一特征相似度,并获取文本特征向量与待匹配轨迹的文本特征模版之间的第二特征相似度;基于第一特征相似度和第二特征相似度进行跟踪匹配,得到第一图像帧中检测对象与待匹配轨迹的轨迹跟踪结果。该方法可以在多目标跟踪中引入语义特征的同时,不受人工设置文本的限制,有效提升多目标跟踪性能。
技术关键词
文本特征向量
跟踪方法
图像特征向量
特征提取模块
文本编码器
图像编码器
预训练模型
轨迹
适配器
模版
非易失性计算机可读存储介质
跟踪装置
对象
多模态
序列
计算机视觉技术
系统为您推荐了相关专利信息
图像配准模型
并行特征
图像特征提取模型
分支
网络
多任务学习网络
模型预测方法
地质结构
数据
弹性波正演方法
ResNet网络
特征提取模块
语义特征提取
位置识别
图像处理方法
电商
葡萄
Attention机制
编码向量
双通道注意力
节点
导航方法
机器人
自然语言文本
生成场景图像