摘要
本申请公开了一种目标检测方法、电子设备、存储介质及程序产品,属于计算机语言技术领域,用以降低大模型进行目标检测的时延。所述方法包括:对待测图像进行预处理,得到所述待测图像在文本嵌入空间的映射特征序列;对所述待测图像中目标对象的类别文本信息进行预处理,得到所述类别文本信息在所述文本嵌入空间的文本嵌入序列;根据预设的查询向量、所述映射特征序列和所述文本嵌入序列,确定所述目标对象的检测特征。
技术关键词
文本
序列
位置特征信息
注意力
计算机语言技术
多模态
计算机程序产品
图像
视觉特征
对象
可读存储介质
电子设备
指令
处理器
存储器
时延
坐标
编码
系统为您推荐了相关专利信息
人眼视线估计方法
细粒度特征
特征提取网络
池化特征
文本编码器
数据分类分级
文本分类模型
样本
跨模态
预测类别