摘要
本发明公开的基于提示学习的单目标跟踪方法,具体包括以下步骤:步骤1,获取跟踪视频,将每一帧的目标区域输入到特征提取网络中,得到深度特征;步骤2,将搜索区域输入到特征提取网络中,得到深度特征;步骤3,将目标区域送入图片生成文本网络,得到提示文本;步骤4,获取文本特征,为每一帧图像配置一段文字,利用特征提取网络对文字进行编码,得到编码文本特征;步骤5,利用多模态特征融合模块分阶段的融合三种文本特征;步骤6,利用损失函数计算检测损失,约束文本提示,完成目标跟踪。本发明的基于提示学习的单目标跟踪方法,解决现有技术中存在的提取目标信息时特征表示有限,导致跟踪精度不足的问题。
技术关键词
特征提取网络
跟踪方法
文本
检测损失
多模态特征融合
图像特征提取
材质特征
坐标
图片
视频
注意力机制
分阶段
颜色
编码器
矩形
纹理
模块
系统为您推荐了相关专利信息
文本
解析方法
非瞬时性计算机可读存储介质
实体
指令执行效率
微带滤波器
全生命周期数据
非线性映射关系
迭代方法
知识图谱构建
汉语言文学计算机联网查询阅读系统
文本
分片
演化规则
索引