摘要
本申请公开了一种对象的识别方法和装置、存储介质及电子设备。其中,该方法包括:获取提示文本和待识别图像;使用连续堆叠的目标融合模块提取提示文本的提示文本特征,和待识别图像的待识别图像特征,融合提示文本特征和待识别图像特征,得到融合特征,并对融合特征执行映射操作,确定语义控制权重向量;使用语义控制权重向量激活目标图像特征,得到文本激活图像特征;基于文本激活图像特征分别执行属性识别任务和目标再识别任务,生成目标识别结果。本申请解决了相关技术中需要预先定义对象属性取值,以识别指定对象,导致对象识别率有限,识别效率过低的技术问题。
技术关键词
控制权
文本特征向量
图像特征向量
样本
语义
融合特征
视觉特征提取
对象
特征提取网络
模块
图像特征参数
状态空间模型
元素
识别方法
注意力
电子设备
系统为您推荐了相关专利信息
高空作业工程
缺陷识别方法
训练图像识别模型
实时图像
实体
特征提取模块
多模态
语音特征提取
非易失性计算机可读存储介质
文本
基线计算方法
光伏发电功率
BIRCH聚类算法
变量筛选方法
数据划分方法