摘要
本发明涉及图像跟踪算法技术领域,更具体的说是一种基于Transformer架构的目标图像跟踪算法。模板和搜索区域图像被分割成标准大小并连接成级联向量,采用ViT作为提出的框架的骨干,并将目标和搜索区域的图像对作为输入,通过结构化先验Transformer网络模块同时进行特征提取和特征融合,利用自注意力空间先验生成网络(SSP)模拟空间特征关联,并提出基于交叉注意力的高斯先验(CGP)和随机先验模块(CRP),分别用来建立特征标记之间的空间依赖关系与目标‑搜索区域之间的匹配关系。最后,将结构化先验Transformer网络模块的输出作为BBox预测网络的输入,以生成跟踪结果。以实现更好的视觉目标跟踪性能。
技术关键词
图像跟踪算法技术
网络模块
标记
生成图像模板
多层感知器
注意力参数
补丁
全卷积网络
结构先验
正则化参数
算法框架
分支
生成模板
坐标
系统为您推荐了相关专利信息
地理实体
命名识别方法
门控循环单元
前馈神经网络
序列
舌体图像分割方法
编码特征
图像嵌入
注意力
舌体特征
服务管理平台
服务管理系统
存储设备
异常信号
数据分析模块
层叠样式表
文档对象模型
逻辑
超文本标记语言
更新方法
多模态数据融合
智能诊断方法
命名实体识别
数据分类
损失函数优化