摘要
本申请涉及一种目标检测方法、装置、电子设备及存储介质,该方法包括:获取待检测图像信息和文本信息;分别对待检测图像信息和文本信息进行特征提取,和融合,得到候选区域和候选区域对应的特征向量V_raw;分别对候选区域对应的特征向量V_raw和文本信息进行编码,得到候选区域对应的嵌入向量V和文本信息对应的嵌入向量T,并计算候选区域对应的嵌入向量V与文本信息对应的嵌入向量T之间的相似度,得到候选区域对应的相似度得分Similarity;对候选区域对应的特征向量V_raw进行聚类和知识蒸馏,得到候选区域对应的语义嵌入Linear;基于候选区域对应的相似度得分Similarity和候选区域对应的语义嵌入Linear,对候选区域进行目标类别分类,以此解决固定类别的检测局限的问题。
技术关键词
语义注意力
联合注意力机制
文本
蒸馏
图像
对象
初始聚类中心
子模块
通信接口
电子设备
存储器
处理器
聚类算法
编码模块
系统为您推荐了相关专利信息
图像超分辨率重建
局部特征提取
全局特征提取
图像重建
地层特征
主题检测方法
训练集
检测头
检测模型训练
融合特征
机械零件尺寸
超分辨率
解码器
语义
canny算法
智能语音客服
加密用户数据
语音特征
语音信号处理
智能语音系统