摘要
本申请公开了一种图像处理的方法、装置、设备及计算机存储介质。获取待跟踪图像帧和指令文本,将待跟踪图像帧和指令文本输入第一模型,利用第一模型对待跟踪图像帧中的目标对象进行特征提取,得到目标对象的目标信息。将待跟踪图像帧和目标信息输入第二模型,利用第二模型对目标信息中的第一目标框中的目标对象进行标注,得到目标掩码向量。将第一目标框和目标掩码向量叠加到待跟踪图像帧上,得到目标跟踪图像。本公开通过获取跟踪图像帧的目标对象对应的目标信息,再根据目标信息获取目标掩码向量。通过第一目标框对目标掩码向量标注的目标对象进行跟踪,使目标对象与第一目标框对应,提高对目标进行跟踪的准确性。
技术关键词
对象
跟踪图像帧
图像处理
计算机程序指令
文本
图像特征提取
计算机存储介质
输入模块
数据
可读存储介质
计算机程序产品
处理器
坐标
注意力
图像分割
视频
系统为您推荐了相关专利信息
图像编码器
预训练模型
多模态
图像嵌入
文本编码器
人交互方法
大语言模型
对话生成模型
语义
多义词
脱硝反应器
催化剂
统计系统
实时数据统计
控制无人机
面向知识图谱
大语言模型
摘要
构建知识图谱
关系